NLP若手の会

お知らせ

NLP若手の会運営委員会(2022年)

委員長
- 萩行 正嗣 (ウェザーニューズ)
- 梶原 智之 (愛媛大)

委員
- 阿部 香央莉 (東北大)
- 大杉 康仁 (NTTレゾナント)
- 高山 隼矢 (ヤフー)
- 中村 優太 (東大)
- 人見 雄太 (Insight Edge)
- 平野 正徳 (東大)
- 三浦 泰嗣 (リクルート)
- 村山 友理 (お茶大)
- 相田 太一 (都立大)
- 岡 佑依 (NTT CS研)
- 平岡 達也 (富士通)
- 村上 聡一朗 (サイバーエージェント/東工大)
- 山田 康輔 (名大)
- 山田 寛章 (東工大)

顧問
- 高瀬 翔 (東工大)

NLP若手の会 (YANS) 第17回シンポジウム 開催報告

2022年8月29日(月)、30日(火)にNLP若手の会第17回シンポジウム(YANS2022)を開催しました。 今年も昨年に引き続き新型コロナウイルス感染症の影響でオンライン開催となりましたが、265名(学生168名、社会人97名)の参加登録と、68件の発表(学生57件、社会人11件)がありました。 株式会社サイバーエージェント様、株式会社PKSHA Technology様、ファーストアカウンティング株式会社様、アマゾンウェブサービスジャパン合同会社様の4企業によるスポンサー支援があり盛況でした。ご参加いただいた皆様、ご支援いただいた皆様、どうもありがとうございました。

本シンポジウムでは、優秀な研究発表に対して奨励賞、スポンサー賞を授与しました。奨励賞はこれから始まる、または始まったばかりの研究を奨励することを主旨とするものであり、現時点の研究の完成度よりもアイデアの面白さ、及び新規性や発展性への期待を重視します。奨励賞の選考は参加者による投票をもとに、最終的には表彰担当者による合議によって10件を選出しました。スポンサー賞は産学交流の一環として各スポンサー独自の視点から受賞者を選出していただきました。いずれの賞も受賞者は筆頭著者のみとなります。

今年も昨年同様チュートリアルを企画し、同志社大学の桂井麻里衣氏に「学術情報検索と推薦」について、名古屋大学の東中竜一郎氏に「対話システムのすすめ」についてご講演いただきました。 また、活躍する若手研究者にご自身の研究について紹介していただく招待セッションを新たに設け、 Microsoftの江里口瑛子氏より「多言語機械翻訳モデルにおける、X-Y方向の翻訳性能改善」、 Megagon Labsの磯颯氏より「Opinion Summarization from Customer Reviews」、 産業技術総合研究所の渡邉研斗氏より「歌詞情報処理という新分野を立ち上げるまで 〜 我儘(?)に研究してきた一人の研究者の例」、 奈良先端科学技術大学院大学の上垣外英剛氏より「自然言語処理における負例サンプリング損失の進展」 という題でそれぞれご講演いただきました。

研究発表に先立ちハッカソンも行われました。今年は、アマゾンウェブサービスジャパン合同会社様よりデータセットと計算機環境をご提供いただき、特定の評価指標を用いたコンペティション形式で開催しました。 13日間のコンペ期間に、Amazon Customer Review Datasetを用いた「商品レビューの役に立つ投票数ランキング」タスクに5チームが取り組みました。シンポジウムのクロージングで最終成果発表を行い、最終評価スコア1位表彰に加えて、アマゾンウェブサービスジャパン合同会社様よりApplied Scientist賞が贈られました。

受賞者

奨励賞

  • [P1-5] 早押しクイズにおける予測処理: 機械の言語処理と人間の言語処理と
    ○山下陽一郎(東大),原田宥都(東大),大関洋平(東大)
  • [P1-6] 言語モデルの第二言語獲得効率
    ○大羽未悠(NAIST),栗林樹生(東北大/Langsmith),大内啓樹(NAIST/理研),渡辺太郎(NAIST)
  • [P1-8] kNN機械翻訳のためのTransformerデコーダ最終層の中間表現の可視化・統計的分析
    ○西田悠人(NAIST),出口祥之(NAIST/NICT),上垣外英剛(NAIST),渡辺太郎(NAIST)
  • [P2-4] 原文に対して補完的な画像はMMTモデルの翻訳精度を向上させるのか
    ○佐藤郁子(都立大),平澤寅庄(都立大),金輝燦(都立大),岡照晃(都立大),小町守(都立大)
  • [P2-8] BERTを用いた文埋め込みモデルによる単語の暗黙的な重み付け
    ○栗田宙人(東北大),小林悟郎(東北大),横井祥(東北大/理研),乾健太郎(東北大/理研)
  • [P3-1] 対照学習による文体に特化した文ベクトルの獲得
    ○銭本友樹(筑波大),宇津呂武仁(筑波大)
  • [P3-2] ニュース用語を含むヒント付きクロスワードパズルの自動生成
    ○馬嶋海斗(東工大),石原祥太郎(日経新聞)
  • [P3-8] Transformerにおけるフィードフォワードネットの混ぜ合わせ作用
    ○小林悟郎(東北大),栗林樹生(東北大/Langsmith),横井祥(東北大/理研),乾健太郎(東北大/理研)
  • [P4-4] Causal言語モデルによる機械翻訳
    ○木山朔(都立大),金輝燦(都立大),平澤寅庄(都立大),岡照晃(都立大),小町守(都立大)
  • [P4-10] 視覚情報は言語モデルに人間らしい統語的汎化を促すか
    ○栗林樹生(東北大/Langsmith)

スポンサー賞

サイバーエージェント賞

  • [P3-1] 対照学習による文体に特化した文ベクトルの獲得
    ○銭本友樹(筑波大),宇津呂武仁(筑波大)

PKSHA Technology賞

  • [P2-8] BERTを用いた文埋め込みモデルによる単語の暗黙的な重み付け
    ○栗田宙人(東北大),小林悟郎(東北大),横井祥(東北大/理研),乾健太郎(東北大/理研)

ハッカソン賞

最終評価スコア1位

  • Natural(チームA)LightGBM のランク学習による商品レビュー評価
    梶川怜恩(愛媛大学),鈴木刀磨(東北大学),二宮大空(サイバーエージェント),石原祥太郎(日本経済新聞社)

Applied Scientist賞

  • Natural(チームA)LightGBM のランク学習による商品レビュー評価
    梶川怜恩(愛媛大学),鈴木刀磨(東北大学),二宮大空(サイバーエージェント),石原祥太郎(日本経済新聞社)

スライドなど

オープニング・クロージング

docs.google.com

docs.google.com

チュートリアル

桂井 麻里衣 氏(同志社大学理工学部):「学術情報検索と推薦」

speakerdeck.com

東中 竜一郎 氏(名古屋大学大学院情報学研究科): 「対話システムのすすめ」

speakerdeck.com

招待セッション

江里口 瑛子 氏(Microsoft): 「多言語機械翻訳モデルにおける、X-Y方向の翻訳性能改善」

drive.google.com

磯 颯 氏(Megagon Labs):「Opinion Summarization from Customer Reviews」

https://isomap.github.io/slides/2022-yans-invited.pdf

渡邉 研斗 氏(産業技術総合研究所):「歌詞情報処理という新分野を立ち上げるまで 〜 我儘(?)に研究してきた一人の研究者の例」

drive.google.com

上垣外 英剛 氏(奈良先端科学技術大学院大学 情報科学領域):「自然言語処理における負例サンプリング損失の進展」

drive.google.com

ハッカソン

ハッカソンについて

yans.anlp.jp

ハッカソン成果報告・表彰

drive.google.com

チーム発表

シンポジウムの様子

昨年と同様に、今年の様子を画像とグラフでお伝えします。

yans2022_poster
ポスターセッションの様子

yans2022_sponsor
スポンサーブースの様子

yans2022_statistics1
学生の割合は6割強でした
yans2022_statistics2
B4とM1の発表が過半数を占めました
yans2022_statistics3
発表申込は締切前に急激に伸びました!
直前期間 (8/19-8/26) の参加申込はわずかでした
yans2022_statistics4
今年は学生の参加が過去最高となりました!
2020年の参加費無料開催を除いて、参加登録数は順調に増加しています
yans2022_statistics5
発表件数は昨年と同程度でした

NLP若手の会 (YANS) 第17回シンポジウム プログラム

更新履歴

  • 2022/08/29: プログラムの一部を変更しました new!
  • 2022/08/19: 招待セッションの詳細を公開しました
  • 2022/08/15: プログラムを公開しました

全体プログラム

シンポジウムはGather.townとZoomを用いて行われます.

参加登録頂いた方には,URLは追って連絡いたします.

下記プログラムは変更になる場合がございますのでご了承ください.

発表者の方へ: ポスターは横置き、3MB まで(幅は最低1000px、高さは最低600px、72dpi以上推奨)、PNGまたはJPG形式で提出してください。
締切:2022年8月22日(月)18:00(UTC+9) 提出方法などの詳細は、発表者の方にメールにてお知らせしております。

ハッカソン:8月16日(火) 〜 8月28日 (日)

ハッカソンについては下記ページを御覧ください.

NLP若手の会 (YANS) 第17回シンポジウム ハッカソン - NLP 若手の会

懇親会:8月28日(日)

[18:00-20:00] 懇親会 (ラウンドテーブル@Zoom)

本シンポジウムでは、参加者間の相互交流を促す企画としてラウンドテーブルを開催します。 テーブル毎にトピックを定め、同じ興味を持った参加者が組織や研究室、業種にとらわれず気軽に雑談・交流できる場を設けます。

トピックにより、少人数でテーブルの割り当てを行います。同じトピックに興味のある様々な方とお話しできるように、テーブルの割り当ては複数回行う予定です。

シンポジウム1日目:8月29日(月)

[09:00-09:30] オープニング

[09:30-10:30] チュートリアル (1)

[10:30-10:35] スポンサーセッション(1)

[10:35-11:00] 小休憩

[11:00-12:00] チュートリアル (2)

[12:00-13:00] 昼休憩

[13:00-14:00] ポスターセッション(1)

[14:00-14:30] 小休憩

[14:30-15:30] ポスターセッション(2)

[15:30-16:00] 小休憩

[16:00-17:00] ポスターセッション(3)

シンポジウム2日目:8月30日(火)

[10:00-10:30] 招待セッション(1)

[10:30-11:00] 招待セッション(2)

[11:00-11:30] 小休憩

[11:30-12:30] ポスターセッション(4)

[12:30-13:30] 昼休憩

[13:30-14:00] 招待セッション(3)

[14:00-14:30] 招待セッション(4)

[14:30-14:35] スポンサーセッション(2)

[14:35-15:00] 小休憩

[15:00-16:00] ポスターセッション(5)

[16:00-16:30] 小休憩

[16:30-17:15] クロージング

発表プログラム

8月29日(月)

チュートリアル (1) 09:30-10:30 「学術情報検索と推薦」

講演者:桂井 麻里衣 氏(同志社大学理工学部)

桂井 麻里衣 氏 講演概要:
国際会議・論文誌の増加や学術データベースの普及に伴い、膨大な量の研究成果情報が日々蓄積されている。これらの学術ビッグデータのうち、特に論文の引用関係やテキストを分析し、関連論文や専門家を検索・推薦する手法が多数提案されている。本チュートリアルではこれらの従来研究を概説するとともに、自然言語処理技術の高度化によって期待される成果について述べる。

略歴:
2010年北海道大学工学部情報エレクトロニクス学科卒業。2012年、2014年にそれぞれ北海道大学大学院情報科学研究科博士前期課程・博士後期課程修了、博士(情報科学)。2014年日本学術振興会特別研究員(PD)、2015年同志社大学理工学部助教、2021年より准教授。マルチメディア検索や学術データ分析の研究に従事。


チュートリアル (2) 11:00-12:00 「対話システムのすすめ」

講演者:東中 竜一郎 氏(名古屋大学大学院情報学研究科)

東中 竜一郎 氏 講演概要:
人間のように会話ができる対話システムの実現は人工知能における大きな目標の一つである.近年,スマートフォン上の音声エージェントやスマートスピーカーが広く利用されるようになり,対話システムがより身近なものになってきた.しかし,満足するような対話が実現できているとは言い難い.本チュートリアルでは,対話システムの現状の技術として,タスク指向型対話システムや非タスク指向型対話システムの方法論,評価手法などを紹介するとともに,人間同士の対話との比較を通して,今後取り組むべき対話システムの課題について述べる.

略歴:
2001年慶應義塾大学大学院政策・メディア研究科修士課程,2008年博士課程修了.2001年日本電信電話株式会社入社.2020年より,名古屋大学大学院情報学研究科教授.NTT人間情報研究所・NTTコミュニケーション科学基礎研究所客員上席特別研究員.慶應義塾大学環境情報学部特別招聘教授.対話システムの研究に従事.著書に「質問応答システム」(コロナ社),「Pythonでつくる対話システム」(オーム社),「AIの雑談力」(KADOKAWA)など.博士(学術).


ポスターセッション(1) 13:00-14:00

  • [P1-1] 自然言語処理を用いた循環器領域におけるバーチャルリアリティ関連研究の動向解析
    ○渡部勇太(愛媛大),檜垣彰典(愛媛大),山口修(愛媛大)

  • [P1-2] 日本語の語彙体系を考慮したサブワード分割による大規模言語モデルへの影響
    勝田哲弘(ワークス),Tolmachev Arseny(ワークス),髙岡一馬(ワークス),内田佳孝(ワークス)

  • [P1-3] カタカナ表記から国際音声記号への高精度変換のためのルール体系
    ○的川雄飛(NAIST),坂井優介(NAIST),大内啓樹(NAIST),渡辺太郎(NAIST)

  • [P1-4] 論述文の深い論理構造の自動解析に向けて
    ○王文質(東北大/理研),Farjana Sultana Mim(東北大),内藤昭一(東北大/理研/リコー),Keshav Singh(東北大),井之上直也(JAIST/理研),乾健太郎(東北大/理研)

  • [P1-5] 早押しクイズにおける予測処理: 機械の言語処理と人間の言語処理と
    ○山下陽一郎(東大),原田宥都(東大),大関洋平(東大)

  • [P1-6] 言語モデルの第二言語獲得効率
    ○大羽未悠(NAIST),栗林樹生(東北大/Langsmith),大内啓樹(NAIST/理研),渡辺太郎(NAIST)

  • [P1-7] ミラーリング機能を搭載したマルチモーダルな傾聴対話システムの開発
    ○水谷林太郎(中央大),鈴木寿(中央大)

  • [P1-8] kNN機械翻訳のためのTransformerデコーダ最終層の中間表現の可視化・統計的分析
    西田悠人(NAIST),出口祥之(NAIST/NICT),上垣外英剛(NAIST),渡辺太郎(NAIST)

  • [P1-9] 化学工学分野の専門用語を理解するBERTモデルの開発
    ○加藤祥太(京大),加納学(京大)

  • [P1-10] 学術ドメインに特化した日本語マスク言語モデルの試作
    ○山内洋輝(愛大),梶原智之(愛大),桂井麻里衣(同大),大向一輝(東大/NII),二宮崇(愛大)

  • [P1-11] ゼロショットテキスト分類におけるドメイン固有キーワードを活用したクラス名混同問題の軽減
    ○矢野太郎(NEC),竹岡邦紘(NEC),小山田昌史(NEC)

  • [P1-12] 音声対話における音節認識結果を用いた未知語検出の検討
    ○大塩幹(阪大),武田龍(阪大),駒谷和範(阪大)

  • [P1-13] Multimodal Sentiment Classification using Modal-independent Classifiers
    ○ティヤジャーモン ナッタポン(東大),吉永直樹(東大)

  • [P1-14] 対照学習を用いた日本語文章埋め込みモデルの開発と評価
    福地成彦(PKSHA),星野悠一郎(PKSHA),渡邉陽太郎(PKSHA)

ポスターセッション(2) 14:30-15:30

  • [P2-1] MC dropoutに基づく確信度を用いた回答可否の予測を伴う対話システム
    ○二宮大空(AIShift),下山翔(AIShift),戸田隆道(AIShift),邊土名朝飛(AIShift),杉山雅和(AIShift),友松祐太(AIShift)

  • [P2-2] 次世代医療基盤法に基づく匿名加工医療情報を利用した入院後敗血症の予測モデルの開発における課題と対策の検討
    ○松田敦義(ログビー),池田遼太郎(ログビー),荒木 賢二(宮崎大),松尾亮輔(ライフデータイニシアティブ)

  • [P2-3] 文書レベル関係抽出における人間と注意機構の根拠文の対応付け
    馬尤咪(東工大),王安(東工大),岡崎直観(東工大)

  • [P2-4] 原文に対して補完的な画像はMMTモデルの翻訳精度を向上させるのか
    ○佐藤郁子(都立大),平澤寅庄(都立大),金輝燦(都立大),岡照晃(都立大),小町守(都立大)

  • [P2-5] 日本語BERTモデルによる近代文のテキスト化の精度向上
    ○謝素春(東北学院大),松本章代 (東北学院大)

  • [P2-6] Document AI タスクに向けた大規模事前学習済みモデルを活用した Layout-aware Prompting
    ○北田俊輔(法政大),井上直人(サイバーエージェント),大谷まゆ(サイバーエージェント),彌冨仁(法政大)

  • [P2-7] 知識グラフに基づく話題の展開・掘り下げを統合した趣味対話生成
    ○藤田敦也(名工大),上乃聖(名工大),李晃伸(名工大)

  • [P2-8] BERTを用いた文埋め込みモデルによる単語の暗黙的な重み付け
    ○栗田宙人(東北大),小林悟郎(東北大),横井祥(東北大/理研),乾健太郎(東北大/理研)

  • [P2-9] 研究者情報収集のためのWebページ分類
    ○林容央(同志社大),桂井麻里衣(同志社大)

  • [P2-10] 所見文書の要約を用いた矯正歯科治療の自動診断の検討
    ○大塚琢生(愛媛大),梶原智之(愛媛大),谷川千尋(阪大),清水優仁(阪大),長原一(阪大),二宮崇(愛媛大)

  • [P2-11] ユーザの性格情報を用いた感情分析
    ○鈴木陽也(愛媛大),梶原智之(愛媛大),二宮崇(愛媛大),中島悠太(阪大),長原一(阪大)

  • [P2-12] 事前学習済みVision and Languageモデルにおける言語情報の獲得過程の調査
    ○白井尚登(NAIST),上垣外英剛(NAIST),渡辺太郎(NAIST)

  • [P2-13] タスク情報を利用した質問応答による情報抽出
    ○山田晃士(豊田工大),三輪誠(豊田工大),佐々木裕(豊田工大)

  • [P2-14] チョムスキー階層とニューラル言語モデル
    ○染谷大河(東大),○吉田遼(東大),中石海(東大),濵西祐之介(東大),大関洋平(東大)

ポスターセッション (3) 16:00-17:00

  • [P3-1] 対照学習による文体に特化した文ベクトルの獲得
    ○銭本友樹(筑波大),宇津呂武仁(筑波大)

  • [P3-2] ニュース用語を含むヒント付きクロスワードパズルの自動生成
    ○馬嶋海斗(東工大),石原祥太郎(日経新聞)

  • [P3-3] 感情極性分類と感情強度推定の同時学習の検討
    ○樽本空宙(愛媛大), 鈴木陽也(愛媛大), 梶原智之(愛媛大), 二宮崇(愛媛大), 中島悠太(阪大), 長原一(阪大)

  • [P3-4] Towards Explicating Implicit Reasoning in Arguments
    ○Keshav Singh, Naoya Inoue, Farjana Sultana Mim, Shoichi Naitoh, Kentaro Inui

  • [P3-5] 敵対的学習による流暢性が高いタグ付け文法誤り訂正システムの構築へ向けて
    ○五藤巧(NAIST),渡辺太郎(NAIST)

  • [P3-6] 事前学習済みモデルを用いたSNS感情分析における絵文字エンコード手法の比較
    ○山内博貴(バンダイナムコ研),頼展韜(バンダイナムコ研)

  • [P3-7] GVTを拡張したモデルによる授業の対話における深い学びの発話抽出
    ○大西朔永(岡山理大),椎名広光(岡山理大),保森智彦(岡山理大)

  • [P3-8] Transformerにおけるフィードフォワードネットの混ぜ合わせ作用
    ○小林悟郎(東北大),栗林樹生(東北大/Langsmith),横井祥(東北大/理研),乾健太郎(東北大/理研)

  • [P3-9] 人の話題遷移モデリングのための基礎分析
    ○岸波洋介(東北大),赤間怜奈(東北大/理研),佐藤志貴(東北大),徳久良子(東北大),鈴木潤(東北大/理研),乾健太郎(東北大/理研)

  • [P3-10] 特定の文脈における正規表現を用いた電話音声認識のドメイン適応の検討
    ○東佑樹(AI Shift),友松祐太(AI Shift)

  • [P3-11] 自然言語推論を用いた文脈情報・ペルソナと一貫性を保つ対話応答選択
    ○義井健史(名工大),上乃聖(名工大),李晃伸(名工大)

  • [P3-12] 化学論文からの情報抽出のためのPDFからXMLへの変換
    ○四條光(NAIST),進藤裕之(NAIST), 渡辺太郎(NAIST)

  • [P3-13] 機械翻訳のための言い換え生成による前編集の検討
    ○惟高日向(愛媛大),岩本裕司(愛媛大),梶原智之(愛媛大),二宮崇(愛媛大),藤田篤(NICT)

8月30日(火)

招待セッション (1) 10:00-10:30 「多言語機械翻訳モデルにおける、X-Y方向の翻訳性能改善」

講演者:江里口 瑛子 氏(Microsoft)
江里口 瑛子 氏

講演概要:
多言語翻訳モデルでは、単一のモデルを複数方向の翻訳データで学習することにより、学習データが存在しないゼロショット方向の翻訳も可能になることが知られている。しかしながら、ゼロショット方向の翻訳性能は限られており、その翻訳誤りの要因の1つに、そもそも指定されたターゲット言語で出力されていないというオフターゲット翻訳問題がある。本発表では、多言語機械翻訳モデルにおけるX-Y方向の翻訳改善を目的として行った、直近の研究成果を紹介する。具体的には、1) X-Y方向の翻訳データが非常に限られている場合 (EMNLP2021にて発表) と、2) X-Y向の学習データがある程度十分に存在する場合 (NAACL2022にて発表) におけるアプローチをいくつか紹介する。

略歴:
マイクロソフト シニアリサーチャー。2019年より現職。2018年東京大学工学系研究科博士課程修了。博士(工学)。2015年-2018年日本学術振興会特別研究員 (DC1)。自然言語処理、機械学習に関する研究に従事。

招待セッション (2) 10:30-11:00 「Opinion Summarization from Customer Reviews」

講演者:磯 颯 氏(Megagon Labs)
磯 颯 氏

講演概要:
オンラインレビュープラットフォームの急速な普及に伴い,人々は食事や就職活動などあらゆることを決める際にレビューを参考するようになっている.しかし,これらのプラットフォームには,毎日大量のレビューが投稿されているため,ユーザが求めている有益な意見を見つけるためには大量のレビュー文書をユーザ自身が時間をかけて読む必要がある.意見要約システムは,レビューから代表的な意見を抽出し,その意見を簡潔でわかりやすい形で要約するシステムである.これにより,生成された要約を読むことで,ユーザはレビューをもとにした意思決定を容易に行うことができる.本講演では,人間が書いた参照要約を必要としない,教師なしのアプローチによる意見要約システムに関する我々の研究について紹介する.

略歴:
Megagon Labs リサーチサイエンティスト.奈良先端科学技術大学院大学修了.博士(工学).自然言語生成,意見要約の研究に従事.

ポスターセッション (4) 11:30-12:30

  • [P4-1] 点予測による高速な形態素解析のための素性とアルゴリズム
    ○赤部晃一(LegalForce),神田峻介(LegalForce),小田悠介(LegalForce/東北大)
  • [P4-2] 共起確率を用いた構文木の自動選択による推論システムの改善
    ○井上裕太(東大),谷中瞳(東大)
  • [P4-3] 固有表現認識タスクにおけるデータセットの偏りに着目した動的重み付け損失関数の提案
    ○根本颯汰(法政大),北田俊輔(法政大),彌冨仁(法政大)
  • [P4-4] Causal言語モデルによる機械翻訳
    ○木山朔(都立大),金輝燦(都立大),平澤寅庄(都立大),岡照晃(都立大),小町守(都立大)
  • [P4-5] 編集操作によるデータ拡張を用いたテキスト平易化の自動評価指標
    ○山中光(東工大),徳永健伸(東工大)
  • [P4-6] 小規模パラレルテキストを用いた類型論的特徴の抽出
    Sung June (NAIST),渡辺太郎(NAIST)
  • [P4-7] 構文森を用いたフレーズアラインメント
    ○門谷宙(阪大),荒瀬由紀(阪大)
  • [P4-8] 疎ベクトル検索における語彙と単語頻度のギャップ解消を通じた教師なしドメイン適合
    ○飯田大貴(東工大),岡崎直観(東工大)
  • [P4-9] 日本語誤り訂正のための誤り区間と誤り種類の自動アノテーションに向けて
    ○古山翔太(東工大/産総研),永田亮(甲南大),高村大也(産総研),岡崎直観(東工大/産総研)
  • [P4-10] 視覚情報は言語モデルに人間らしい統語的汎化を促すか
    栗林樹生(東北大/Langsmith)
  • [P4-11] スパンベースの句構造解析のためのラベル詳細化とその分析
    ○芳賀あかり(NAIST),渡辺太郎(NAIST)
  • [P4-12] 文脈を考慮したニューラル音声認識誤り訂正
    ○中村朝陽(東大),吉永 直樹(東大)
  • [P4-13] 知識グラフを拡張する遠距離教師あり関係抽出
    ○松原拓磨(豊田工大),三輪誠(豊田工大),佐々木裕(豊田工大)

招待セッション (3) 13:30-14:00 「歌詞情報処理という新分野を立ち上げるまで 〜 我儘(?)に研究してきた一人の研究者の例」

講演者:渡邉 研斗 氏(産業技術総合研究所)
上垣外 英剛 氏

講演概要:
研究活動の大きな原動力の一つとして「こんなことが実現できれば自分は嬉しい」というものがある.発表者は「計算機に自分のための歌を創って歌ってほしい」という夢を実現させるために「歌詞情報処理」という新しい研究分野を提案し,切り開いてきた.本発表では,これまで研究してきた歌詞情報処理技術を紹介するとともに,歌詞情報処理分野が目指すべき未来について述べる.

略歴:
2013年東北大学工学部情報知能システム総合学科卒業.2018年東北大学大学院情報科学研究科博士課程修了.2018年より産業技術総合研究所 人間情報インタラクション研究部門の研究員として,歌詞を中心とした自然言語処理・音楽情報処理・ヒューマンコンピュータインタラクションの研究に従事.

招待セッション (4) 14:00-14:30 「自然言語処理における負例サンプリング損失の進展」

講演者:上垣外 英剛 氏(奈良先端科学技術大学院大学 情報科学領域)
上垣外 英剛 氏

講演概要:
負例サンプリングに基づく損失は計算効率に優れ,語彙などの膨大な異なり数からなるラベルを対象とした学習を行う上での重要な手法である.本チュートリアルではword2vecから最新の事前学習済み言語モデルでの利用に至るまでの負例サンプリング損失に関する研究の動向について紹介し,類似する学習手法およびその他の損失関数との関係についても説明する.また後半では特に,近年負例サンプリング損失が活発に利用されている知識グラフの埋め込みの分野に焦点を当て,我々が現在行っている負例サンプリング損失に対する理論的側面からの研究についても説明する.

略歴:
2017年3月 東京工業大学 大学院総合理工学研究科 知能システム科学専攻にて博士(工学)を取得.2017年4月 NTTコミュニケーション科学基礎研究所 リサーチアソシエイト,2018年4月 東京工業大学 科学技術創成研究院 未来産業技術研究所 助教 を経て,2022年4月より 奈良先端科学技術大学院大学 先端科学技術研究科 情報科学領域 准教授.

ポスターセッション (5) 15:00-16:00

  • [P5-1] 最小コスト法による形態素解析のキャッシュ効率改善
    ○神田峻介(LegalForce),赤部晃一(LegalForce),後藤啓介(LegalForce),小田悠介(LegalForce/東北大)
  • [P5-2] 専門用語に基づいた文書分類モデルの説明可能性の向上に向けて
    ○田村みゆ(日本女子大),沼澤翠(日本女子大),梶浦照乃(日本女子大),倉光君郎(日本女子大),七丈直弘(一橋大)
  • [P5-3] 追加事前学習による誤字脱字に強い言語モデルに向けて
    ○佐藤美唯(日本女子大),梶浦照乃(日本女子大),相馬菜生(日本女子大),高橋舞衣(日本女子大),田村みゆ(日本女子大),倉光君郎(日本女子大)
  • [P5-4] 能動的な対話システム実現に向けた談話マーカーの利用の検討
    ○守屋彰二(東北大),岸波洋介(東北大),徳久良子(東北大),乾健太郎(東北大/理研)
  • [P5-5] 事前学習を用いる機械翻訳での単語分割同時最適化の検討
    ○榎本大晟(都立大),平澤寅庄(都立大),金輝燦(都立大),岡照晃(都立大),小町守(都立大)
  • [P5-6] 訓練データからの文選択手法の機械翻訳における特徴分析
    ○中島京太郎(都立大),金輝燦(都立大),平澤寅庄(都立大),岡照晃(都立大),小町守(都立大)
  • [P5-7] Are Neighbors Enough? Multi-Head Neural n-gram can be Alternative to Self-attention
    ○Mengsay Loem(東工大),高瀬翔(東工大),金子正弘(東工大),岡崎直観(東工大)
  • [P5-8] 最適輸送に基づくBERTScoreによる文書類類似度の高精度化へむけて
    ○潘岳(NAIST)
  • [P5-9] 英単語穴埋め問題における選択肢の自動生成に向けて
    ○吉見菜那(愛媛大),廣中勇希(愛媛大),梶原智之(愛媛大),荒瀬由紀(阪大),内田諭(九大),二宮崇(愛媛大)
  • [P5-10] 推論過程の性質がニューラルネットの多段推論能力に与える影響
    ○青木洋一(東北大),工藤慧音(東北大),栗林樹生(東北大/Langsmith),Ana Brassard(理研/東北大),吉川将司(東北大),乾健太郎(東北大/理研)
  • [P5-11] 旅行者の移動軌跡を地図上に描くための訪問順序アノテーション
    山本和太郎(NAIST),東山翔平(NICT),大友寛之(NAIST),大内啓樹(NAIST/理研),渡辺太郎(NAIST)
  • [P5-12] 論理的根拠に基づく頑健な機械読解に向けて
    ○原口大地(JAIST),白井清昭(JAIST),井之上直也(JAIST/理研)
  • [P5-13] データベースのテキスト情報を追加した大規模文献グラフを用いた表現学習
    ○井田龍希(豊田工大),片桐脩那(豊田工大),三輪誠(豊田工大),佐々木裕(豊田工大)
  • [P5-14] ラベル情報の符号化による複数コーパスからの固有表現抽出モデルの学習
    ○大井拓(豊田工大),三輪誠(豊田工大),佐々木裕(豊田工大)

プライバシーポリシー

NLP若手の会(以下、本会)は、個人情報の重要性を認識し、個人情報の保護についての法令を遵守し、その取得・利用・管理について、以下の方針に基づき適切に取り扱うよう努めます。

■個人情報収集の基本方針

本会は、本会の主催するイベントの参加者及び付随する各種サービス(webサービス・各種問い合わせの受付等)の利用者、および本会の事業に関わる関係者から任意に提供される情報を、必要な範囲で収集します。個人情報を収集する際は、その目的を明示するとともに、提供者の同意に基づくことを原則とします。

■個人情報の利用

本会は、提供いただいた個人情報を、下記の目的の範囲内で利用します。また、提供いただいた個人情報は、特段の事情がある場合を除き、本人の同意なく第三者へ開示提供することはありません。

  1. 本人確認、イベント申込に関するサービスの提供、料金の請求、及び利用サービス提供条件の変更・停止・中止・契約解除の通知
  2. イベントの開催案内等、イベント運営に関わる必要な情報の提供
  3. 上記の他、本会の各種イベント・サービスに関する情報提供
  4. 本会の事業運営の改善を目的とした調査への協力依頼

次のいずれかの場合には上記収集目的以外に個人情報を利用し、または開示提供することがあります。
1. 法令の規定に基づく場合
2. 提供者本人の同意がある場合
3. 不正アクセス、脅迫等の違法行為があったときその他特別の理由のある場合
4. 事業目的の達成のために必要な範囲内において個人データの取扱いの全部又は一部を委託する場合

■個人情報の管理

本会は、収集した個人情報が外部へ漏洩したり、破壊や改ざんを受けたり、紛失したりすることの無いよう適切な管理に努めます。ただし、提供者自身により開示された個人情報および既に公開されている個人情報については、本会の管理の対象外とします。

■個人情報の開示および訂正等

本会は、個人情報の提供者本人から自己に関する個人情報の開示の請求があったときは、原則として遅滞なく開示します。また、自己に関する個人情報の訂正等の申し出があったときは、原則として遅滞なく訂正等を行います。

■プライバシーポリシーの変更について

本会は、予告無くプライバシーポリシーを変更することがあります。プライバシーポリシーの改定があったときは、本会が運営するウェブサイトに遅滞なく掲載いたします。

■個人情報の取り扱いに関する問い合わせ先

本会における個人情報保護に関してご質問などがある場合は、下記までご連絡下さい。

NLP若手の会 運営委員会
yans2022committee (at) googlegroups.com

NLP若手の会 (YANS) 第17回シンポジウム ハッカソン

■更新履歴

  • 2022/08/09: ハッカソン参加者向けアナウンス,およびハッカソンの内容の説明を追加しました
  • 2022/06/30: ハッカソン参加募集ページを公開しました

■重要日程

  • コンペ用データ募集期間:2022/07/01(木) 00:00 〜 2022/07/21(木) 15:00
  • 参加申し込み期間:2022/07/15(金) 00:00 〜 2022/08/15(月) 15:00
  • ガイダンス(Slackでの投稿に加え,Zoomにて実施):2022/08/16(火) 13:00 ~ 14:00
  • コンペ開催期間:2022/08/16(火) 14:00 〜 2022/08/28(日) 17:00
    • Amazon SageMaker Studio Labのアカウント登録 (リファラルコードの期限あり):2022/08/16(火) 13:00 ~ 2022/08/17(水) 13:00
    • リーダーボードセットの出力結果を少なくとも1回リーダーボードに提出:〜2022/08/21(日) 12:00
    • 最終評価セットの出力結果の提出:〜2022/08/28(日) 12:00
    • 発表スライドとソースコードの提出:〜2022/8/28(日) 17:00
  • 成果報告会:2022/08/30(火)シンポジウム2日目のクロージング
  • ハッカソン参加者懇親会:2022/08/30(火)シンポジウム2日目のクロージング後

■ハッカソン参加者向けアナウンス

参加同意書

シンポジウム申し込み時に「ハッカソンに参加する」と回答していただいた方に向けて,登録されたメールアドレスに参加同意書を送信いたします. ガイダンスまでにご提出ください. ご提出いただいた方から,ガイダンス以降,チームを発表しますので,できるだけ早くご提出いただけると幸いです. 参加同意書を提出いただけない方はハッカソンに参加できませんので,ご承知おきください. 提出方法はメールをご確認ください.

ガイダンスまでに参加同意書のメールが届いていない方は,お手数ですが yans2022committee (at) googlegroups.com までご連絡ください.

ガイダンス

ハッカソンを開催するにあたり,ガイダンスを2022/08/16(火)の13:00から実施します. ハッカソンに参加する方は,ぜひご参加ください. また,今回のハッカソンでは,計算機環境としてAmazon SageMaker Studio Labを利用します. アカウントを即時発行するリファラルコードの説明やチュートリアルの実施もあるので,ぜひご参加ください. Zoomのリンクはメール,およびSlackにて共有します. 後日,録画したものの共有を予定しています.

  • ハッカソンの内容の解説 (15分程度)
  • Amazon SageMaker Studio Labのチュートリアル (15分程度)

■ガイダンス時に使用する説明スライド

■概要

ハッカソンスポンサーとしてアマゾンウェブサービスジャパン合同会社様に協力していただき,ECサイトAmazonのレビューデータを用いた特定の評価指標によるコンペティションを開催します. 1チームあたり4名程度で,優秀なチームには表彰があります.

  • 最終評価セットにてスコアの高かったチームへの表彰
  • システムの実装と発表内容に基づいたハッカソンスポンサーからの表彰
    • アマゾンウェブサービスジャパン合同会社様から「Applied Scientist賞」
      • アプローチの新規性: 既存の手法を拡張、応用することで新規・創造性のある手法で解決しているか
      • 実装の実現性: 現実の問題に適用可能な効率的かつスケールする実装を行えているか
      • 背景知識の豊富さ: 先進的な原理と手法を理解し利用できているか

■タスク

各チームには,Amazon商品レビューの商品ごとの「役に立つ投票数」のランキングタスクに取り組んでもらいます. 有用なレビューの予測に貢献でき,レビューをサイトに表示する際の手がかりになります.

■配布データ

Amazon Customer Review Datasetを利用します.提供データは以下のようになっています.(データ数などはスライドに記載)

  • 学習セット:システム開発に利用するための「役に立つ投票数」を含むレビューデータ
  • リーダーボードセット:リーダーボードに途中結果を表示するための「役に立つ投票数」を含まないレビューデータ
  • 最終評価セット:最終順位を決定するための「役に立つ投票数」を含まないレビューデータ

データの入手方法

  • 学習セットとリーダーボードセット:8/16 (火) のガイダンス時に,入手方法をご連絡します.
  • 最終評価セット:8/26 (金) に配布予定です.入手方法は後日ご連絡します.

■評価方法

評価指標

最終評価セットのk=5のNormalized Discounted Cumulative Gain (NDCG@5) になります.(詳細はスライドに記載)

リーダーボード(https://yans2022hackathon.pythonanywhere.com/

リアルタイムにモデルのスコアを測定できるリーダーボードを用意しています.リーダーボードセットにおけるシステムの出力結果を提出し,運営委員がスコア計算用スクリプトで評価します.なお,参加者が最後に提出した出力結果のスコアが掲載されます.リーダーボードに掲載されるスコアおよび順位は,あくまでも最終順位の目安です.

最終評価

最終評価セットの全てに対するシステム出力を提出してください.提出された出力結果の中から,委員側で最終評価データを選定し,スコア計算用スクリプトによって評価し,最終的な順位とします.

ベースラインシステム

■シンポジウムでの成果発表

開発されたシステムの概要や手法の特徴、評価結果の分析等を,シンポジウムにて発表(1チーム3分程度)していただきます. 成果発表会はシンポジウム2日目のクロージングにて開催を予定しています.

■提出方法

出力結果の提出フォーマット

出力結果のフォーマットは,ベースラインシステムのREADME.md (https://github.com/Kosuke-Yamada/yans2022-hackathon-baseline) にしたがってください. ファイル形式は1行ごとのJSONファイルである.jsonlとしてください. ファイル名に関して,リーダーボードセットではsubmit_leader_board.jsonlとしリーダーボードへ提出してください. また,最終評価セットではsubmit_final_result.jsonlを含むチーム名のわかるzipファイル (たとえば,team_z.zip) として提出してください.

スライドとソースコード

  • スライドはpdf形式,ソースコードは使用したコードをまとめたzipファイルを提出してください.それぞれチーム名がわかるようにしてください.

提出先

  • リーダーボード評価:ハッカソン開始時にアナウンスします

  • 最終評価:後日アナウンスします

  • スライドとソースコード:後日アナウンスします

■ハッカソンの手順まとめ

ハッカソンの手順は以下の通りです.

  1. 配布データをダウンロード
  2. 学習セットを利用して,ランキングシステムを開発
  3. リーダーボードに,リーダーボードセットの全ての商品に対する出力結果を提出してスコアを確認
  4. 最終評価セットの全ての商品に対する出力結果を提出
  5. システムのソースコードと,開発したシステムの概要や評価結果の分析結果をスライドにまとめて提出
  6. シンポジウムにて作成したスライドを基に発表

■計算機環境

  • Amazon SageMaker Studio Lab
    • リファラルコードの発行およびチュートリアルを実施
    • 原則,この環境で動く範囲のシステムを開発してください
  • Google colab pro+
    • Google colab pro+の請求書をYANSのメールアドレス (yans2022committee (at) googlegroups.com) に送っていただいた方は,2022年8月分を全額補助 (5,243円/月,2022/8/15現在)
      • 請求書添付用メールのテンプレートはslackをご確認ください

■ルール

  • 参加希望者を運営側で,1チームあたり4名程度で振り分けます
    • アンケートに回答いただき,参加者の経験をもとにチームの振り分けます
  • 一般に無償公開されているデータのみ使用してください
    • 他チームが再現できるかを基準に判断してください
    • 独自に作成したデータであっても,無償公開すれば利用可能です
  • 人力での解答は禁止とします
  • Amazonレビューデータセットは利用しないでください
  • チーム内のコミュニケーションツールとしてYANS2022のslackを提供します
    • それ以外のツールの使用については各チームに任せます

参加者募集

■概要

特定の評価メトリックを用いたコンペ形式の競争になります.
コンペテーマ及びデータにつきましては,外部組織から募集いたします.
データ提供に協力いただいた組織につきましては,ハッカソンスポンサーとしてHPに記載させていただきます.
加えて,YANS第17回シンポジウム(2022)の3名の無料参加枠,及びシンポジウムの2日目(8/30火)に「企業の宣伝」と「テーマ説明」をする時間として5分の発表枠を提供いたします.

■コンペテーマ応募方法

コンペテーマの募集期間は終了しました
募集の締め切りは2022/07/21(木) 15:00です.

ご不明な点があれば,お気軽に yans2022committee (at) googlegroups.com までご連絡ください.

■参加者募集

ハッカソンの参加申し込み期間は終了しました

NLP若手の会 (YANS) 第17回シンポジウム スポンサー募集のお知らせ

NLP若手の会 (YANS) では、自然言語処理および関連分野の若手研究者・若手技術者の交流を促進し、若手のアクティビティを高めることを目的とし、年に一度YANSシンポジウムを開催しております。2020年には334名、2021年には221名の参加をいただいており、若手研究者、特に学生の交流の場として大変盛況となっております。参加者の交流を促進するため、交流企画を積極的に行っているのが特徴です。

YANSシンポジウムでは学生の参加を推奨しており、同分野で頑張る仲間とのつながり、また将来のキャリア形成の参考となる若手研究者・技術者や企業様との交流を持てるよう、できるだけ参加にかかる費用を抑えるようにしております。このような事情ですので、YANSシンポジウムのスポンサー・後援を通してご支援をいただければ大変ありがたく存じます。

第17回シンポジウム (2022年) のスポンサー企業・後援団体にお申し込みいただけるご担当者様は、募集要項をお読みいただき、以下の期間内に yans2022committee+sponsorship@googlegroups.com まで必要事項を明記のうえご連絡ください。

お申込みは先着順とさせていただきます。支援企業・団体様と参加者の交流機会を担保するため、お申し込み多数の場合には、締め切り日を繰り上げさせていただくこともございます。 できましたらお早めのお申し込みをお願い申し上げます。

過去のシンポジウムにご支援いただいた企業・団体様は以下のリンクよりご参照いただけます。また過去のシンポジウムの開催報告も掲載しておりますので、よろしければご参照ください。

第14回シンポジウム(2019年)スポンサー企業・後援団体様

第13回シンポジウム(2018年)スポンサー企業・後援団体様

第12回シンポジウム(2017年)スポンサー企業・後援団体様

以上、よろしくご検討下さいますよう、お願い申し上げます。

NLP若手の会 2022年委員長

萩行 正嗣
梶原 智之

受付期間

2022年7月7日(木)〜2022年8月5日(金)

※ 受付は終了しました

募集要項

ご応募いただく企業・団体様は、自然言語処理技術を製品開発にご活用されている、もしくは自然言語処理研究に取り組まれていることを原則といたします。 ご支援いただきました資金は、主に参加者交流促進のためのイベント企画運営および参加者の経済的負担を軽減する目的で利用いたします。

申し込み必要事項

  • 企業名・団体名

  • 種別(スポンサー/後援): 「スポンサー」と「後援」のどちらかをお選びください(名称のみの違いとなります)。加えて、ご希望のコースを「プラチナ」「ゴールド」「シルバー」よりお選びください。

  • ご担当者様の氏名・部署名・メールアドレス・電話番号

  • 掲載名称(企業名・団体名):Webページに掲載します。

  • 掲載名称(企業名・団体名)のフリガナ

  • ロゴ画像:事務局にてWebページへ掲載いたします。横450 px ・縦200 px 以上のなるべく大きなサイズの画像 (PING, JPEG, GIF形式が可能です) をご用意願います。

  • URL (1つのみ) :ロゴ画像からリンクいたします。

  • スポンサーブースの有無:「スポンサーブース」の利用の有無をお知らせください。

  • 電子パンフレット配布の有無:「電子パンフレット配布」の利用の有無をお知らせください。

  • ノベルティの配送代行の有無:「ノベルティの配送代行」の利用の有無をお知らせください。

  • スポンサー賞 / 口頭発表 の選択:「ゴールド」をご選択の場合は、口頭発表、スポンサー賞の授与のどちらを希望されるかお知らせください。

申し込みフォーマット

  • 企業名・団体名:
  • 種別(スポンサー/後援):
  • 担当者
    • 氏名:
    • 部署名:
    • メールアドレス:
    • 電話番号:
  • 掲載名称(企業・団体名):
  • 掲載名称(企業・団体名)のフリガナ:
  • ロゴ画像: (添付ファイルにてお送り下さい)
  • URL:
  • スポンサーブース:有り・無し
  • 電子パンフレット配布:有り・無し
  • ノベルティの配送代行:有り・無し
  • スポンサー賞 / 口頭発表 :(ゴールドの場合、ご記載下さい)

支援種目

スポンサー・後援 料金 ロゴ ブース 招待枠 電子パンフレット配布 ノベルティの配送代行 口頭発表 スポンサー賞
プラチナ 30万円 特大 3名
ゴールド 20万円 3名 いずれか1つを選択
シルバー 10万円 3名

※ハッカソンスポンサーをご希望の企業・団体様は こちらのページ よりお申し込みください。

特典

1)ロゴ

NLP若手の会のWebページに、御社のロゴを掲載いたします。ロゴの大きさはスポンサーの種類により異なります。同一種類のスポンサー内での掲載順序は基本的に申し込み順とさせて頂きます。Webページからは、ご希望のリンク先1ヶ所に対するリンクを張ることができます。

2)スポンサーブース

Gather.townでスポンサーブースをご利用いただけます。今年はスポンサーブースのより一層の活性化のためにスタンプラリー企画を実施致します。

3)招待枠

3名分の参加費を無料とさせていただきます。

4)電子パンフレット配布

スポンサー様のパンフレット等の電子データをシンポジウムの参加者の皆様へ一括配布致します。

5)ノベルティの配送代行

スポンサー様よりシンポジウム参加者へご提供したいノベルティの配送代行を承ります。

6)口頭発表

スポンサー企業・後援団体様で取り組まれておられる自然言語処理や機械学習関連技術の活用に関する話題を中心にお話しいただけます。新卒・中途社員募集やアルバイト・インターン募集に関する告知を行っていただくことも可能です。発表時間は5分です。

7)スポンサー賞

ポスター発表を行った学生に対し、スポンサー賞を授与していただけます。受賞者は、スポンサー様それぞれで1名ずつ決定していただきます。副賞をスポンサー様よりご用意いただだき、授与していただくことも可能です。スポンサー賞授与式は、シンポジウム最終日のクロージングでの実施を予定しております。スポンサー賞の詳細については、授与を希望されるスポンサー様に別途ご連絡させていただきます。

口頭発表、ブース、ノベルティ、パンフレットなどの特典の詳細については、スポンサー・後援のお申込み後にご連絡させていただきます。また口頭発表のタイトルや概要の締め切りは別途設定させていただきます。

ご質問等ございましたら、yans2022committee+sponsorship@googlegroups.com までご連絡ください。

NLP若手の会 (YANS) 第17回シンポジウム スポンサー一覧

NLP若手の会 (YANS) 第17回シンポジウムは以下のスポンサーの皆様に協賛いただいております。

プラチナスポンサー

株式会社サイバーエージェント
株式会社サイバーエージェント
株式会社PKSHA Technology
株式会社PKSHA Technology

シルバースポンサー

ファーストアカウンティング株式会社
ファーストアカウンティング株式会社

ハッカソンスポンサー

Powered by AWS Cloud Computing
アマゾン ウェブ サービス ジャパン合同会社