NLP若手の会

お知らせ

NLP若手の会運営委員会(2021年)

委員長
- 高瀬 翔 (東工大)
- 萩行 正嗣 (ウェザーニューズ)

委員
- 久保 隆宏 (TIS株式会社)
- 中山 祐輝 (楽天技術研究所)
- 丹羽 彩奈 (東工大)
- 濵園 侑美 (お茶大)
- 平澤 寅庄 (都立大)
- 舟木 類佳 (株式会社LegalForce)
- 阿部 香央莉 (東北大)
- 大杉 康仁 (NTT MD研)
- 高山 隼矢 (阪大)
- 中村 優太 (東大)
- 人見 雄太 (Insight Edge)
- 平野 正徳 (東大)
- 三浦 泰嗣 (リクルートライフ)
- 村山 友理 (お茶大)

顧問
- 井之上 直也 (Stony Brook University)

NLP若手の会 (YANS) 第16回シンポジウム 開催報告

2021年8月30日(月)、31日(火)、NLP若手の会第16回シンポジウム(YANS2021)を開催しました。

今年も昨年に引き続き、COVID-19の影響でオンライン開催となりましたが、221名(学生137名,社会人84名)の参加登録と、71件の発表(学生61件,社会人10件)があり、盛況でした。 また、今年はチュートリアルも企画し、筑波大学の馬場雪乃氏に「Human-in-the-loop 機械学習」を、NAISTの渡辺太郎氏に「Back to the noisy channel」をご講演いただきました。

ご参加いただいた皆様、どうもありがとうございました。

研究発表に先立ち、ハッカソンも行いました。 今年は、参加者の皆様からデータ提供を募り、特定の評価メトリックを用いたコンペ形式としました。 コンペ期間を2週間に設定し、理研AIPの森羅を用いたWikipediaからの属性値抽出に5チームが取り組みました。 途中結果をリーダーボードで共有し、シンポジウム最終日にハッカソンの最終成果発表を行いました。

スライドなど

オープニング・クロージング

drive.google.com drive.google.com

チュートリアル

馬場 雪乃 氏(筑波大学): 「Human-in-the-loop 機械学習」

speakerdeck.com

渡辺 太郎 氏 (NAIST): 「Back to the noisy channel」

docs.google.com

ハッカソン

ハッカソンについて

yans.anlp.jp

ハッカソン成果報告 表彰

drive.google.com

チーム発表

シンポジウムの様子

昨年に引き続き、今年の様子を画像とグラフでお伝えします。

f:id:YANS:20210903152146p:plain
gatherでシンポジウム会場を設営しました
f:id:YANS:20210903152251p:plain
雑談部屋では、それぞれのエリアで個別で話せるようにしました
f:id:YANS:20210903150801p:plain
ポスターセッションの様子
f:id:YANS:20210903151821p:plain
素敵なビーチも用意しました
f:id:YANS:20210904165020p:plain
今年は学生の参加が多くなりました
f:id:YANS:20210904164749p:plain
申込期間を3つに分けて
価格に変動をつけました
直前での申込が減少しました
f:id:YANS:20210904164807p:plain
発表を行う方の参加申込は
通常申込期間に増えました
f:id:YANS:20210903172631p:plain
今年の参加者数は昨年よりは少ないものの、参加費有料開催では増加傾向です
f:id:YANS:20210903172601p:plain
今年の発表者数は昨年よりも多くなりました

NLP若手の会 (YANS) 第16回シンポジウム ハッカソン

■更新履歴

■概要

特定の評価メトリックを用いたコンペ形式の競争になります. 公開システムは, 森羅 SHINRA – Wikipedia 構造化プロジェクト で活用される予定であり,日本語における知識ベースの構築に貢献することができます.

■タスク

各チームには,Wikipedia記事から各カテゴリに設定された属性の値を抽出するタスクに挑戦してもらいます.例えば,以下のように「シャネル」というタイトルのWikipedia記事の中から,事前に定義された属性(正式名称,設立年,本拠地国など)に対応する値を抽出します.(詳細はスライドを参照) f:id:YANS:20210804173006p:plain

■配布データ

データ概要

理研AIP言語情報技術アクセスチームが提供する森羅2020JP-5(森羅2020-JP: 日本語構造化タスク – 森羅 SHINRA)の中で,「市町区村名」と「企業名」の2カテゴリを対象とします. 学習データを用いて期間中に開発を行っていただき,テストデータを用いて最終的な評価結果を決定します.提供データは以下からなります.

  • ターゲットデータ:属性値の抽出対象ページ(JP-5内の全ページ)
    • 学習データ:モデルの学習と開発に使用してください(正解は公開です)
    • 最終評価用データ:最終的な順位づけを行うためのテストデータです(対象データと正解は非公開です)
  • リーダーボード用評価データ:リーダーボード上での評価を行うためのテストデータです

データの入手方法

[ターゲットデータ] ハッカソン開始時にSlackにてご連絡します

[リーダーボード用評価データ] ハッカソン開始時にSlackにてご連絡します

■評価方法

評価指標

最終評価データの2カテゴリにおけるFスコアの平均値とします. GitHub - k141303/shinra_jp_scorer: 森羅2020タスク用のスコアラーを用いてシステムを評価できます.

リーダーボード(https://yans2021hackathon.pythonanywhere.com/

リアルタイムにモデルのスコアを測定できるリーダーボードを用意しています.リーダーボード用の評価データを参加者に期間中のみ公開します.システムの出力結果を提出し,運営委員がスコア計算用スクリプトで評価します.なお,参加者が最後に提出した出力結果のスコアが掲載されます.リーダーボードに掲載されるスコアおよび順位は,あくまでも最終順位の目安です.

最終評価

ターゲットデータデータ全てに対するシステム出力を提出してください.提出された出力結果の中から,委員側で最終評価データを選定し,スコア計算用スクリプトによって評価し,最終的な順位とします.

ベースラインシステム

■シンポジウムでの成果発表

開発されたシステムの概要や手法の特徴、評価結果の分析等を,シンポジウムにて発表(1チーム3分程度)していただきます.

■提出方法

フォーマット

出力結果のフォーマットは,森羅2020-JP: データフォーマット – 森羅 SHINRAにしたがってください.学習データと森羅2019のシステム出力と同じ形式になります.2カテゴリ分のJSONファイル一式を一つのディレクトリに格納し、zipファイルとして提出してください.実行結果のファイル名はCity.jsonとCompany.jsonとして下さい.参加グループ名が分かるフォルダをzip形式で圧縮したものをご提出ください.

提出先

リーダーボード評価:YANS2021 ハッカソン - リーダーボード

最終評価:後日アナウンスします

■ハッカソンの手順まとめ

ハッカソンの手順は以下の通りです.

  1. 配布データをダウンロードしてください
  2. 学習データを使って属性値抽出システムを開発してください
  3. リーダボードを使用する場合は,リーダーボード用評価データ全てに対する出力結果を提出し,スコアを確認してください
  4. ターゲットデータ全てに対するシステム出力を、8/30(月)15時までに所定フォーマットにしたがって提出してください
  5. 最終評価データ部分の評価結果を返却します
  6. 開発されたシステムの概要や手法の特徴、評価結果の分析等を,シンポジウムにて発表(1チーム3分程度)して下さい

■ルール

  • 利用可能なデータは、一般に無償公開されているデータのみとします
    • 他チームが再現可能かを基準にして判断してください
    • 独自に作成したデータであっても,無償公開すれば利用可能です
  • 人手でのテストデータに対する解答を禁止します
  • 計算リソースは参加者側で用意してください
  • チーム内のコミュニケーションツールとしてYANS2021のslackを提供します
    • それ以外のツールの使用については各チームに任せます

■重要日程

  • 参加申し込み期間2021/07/01(木) 00:00 〜 2021/07/21(水) 15:00
  • コンペ用データ募集期間2021/07/01(木) 00:00 〜 2021/07/21(水) 15:00
  • ガイダンス(Slackにて投稿)2021/08/16(月) 00:00
  • コンペ開催期間:2021/08/16(月) 18:00 〜 2021/08/29(日) 21:00
  • ターゲットデータ全てに対するシステム出力結果の提出:2021/8/27(金)9:00〜2021/8/30(月)15:00
  • 発表スライドの提出:〜2021/8/30(月)21:00
  • 成果報告会:2021/08/31(火)シンポジウム2日目

参加者募集(参加者・データ提供ともに募集は終了しました)

ハッカソン内容

特定の評価メトリックを用いたコンペ形式の競争になります。 コンペで使用するデータセットについては,参加フォームより募集を行います。 このため、コンペのデータとタスクについては後日告知させて頂きます。(公開時期は8/13(金)を予定しております) 以下ハッカソン詳細について目を通した上で,参加申し込みをお願いいたします。 ※成果物や提供されたデータに関する著作権等を守るため、ハッカソン開催前に参加者全員に同意書の提出をお願いする予定です.

参加形式

3人1組のチーム制です. ハッカソン参加希望者に後ほど配布するアンケートにて,「NLP経験年数」,「Kaggle等コンペ経験年数」,「プログラミング経験年数」などをお聞きし,チームのスキルレベルが偏らないように運営側でチームの編成を行います. またチーム内の所属が被らないように調整も行います. 場合により,一部4人チームを編成します. チーム編成の発表は8/13(金)を予定しております.

参加条件

計算資源は運営側で用意できないため,計算資源を用意できる方のみの参加とさせていただきます. 学生,社会人問わず奮ってご参加ください. シンポジウム2日目の8/31(火)にチームでの取り組みを1チーム3分程度で発表頂く予定です.

データ募集

本コンペで使用するデータを募集します. データの著作権,知財等は当該素材の提供元である企業に帰属する旨を,参加同意書にて参加者に提出していただきます. なお,データ提供希望者と運営委員で複数回の打ち合わせを予定しておりますので,ご了承の上,データ提供希望を申請してください.

NLP若手の会 (YANS) 第16回シンポジウム プログラム

更新履歴

  • 2021/08/26: プログラムの一部を変更しました new!
  • 2021/08/21: プログラムの一部を変更しました
  • 2021/08/05: プログラムを公開しました

全体プログラム

シンポジウムはGather.townとZoomを用いて行われます.

参加登録頂いた方には,URLは追って連絡いたします.

下記プログラムは変更になる場合がございますのでご了承ください.

発表者の方へ: ポスターは横置きのJPGかPNGファイルとして作成してください.提出方法などの詳細は,近日中にメールにてお知らせいたします.

ハッカソン 2021/08/16(月) 〜 2021/08/29(日)

ハッカソンについては下記ページを御覧ください.

NLP若手の会 (YANS) 第16回シンポジウム ハッカソン - NLP 若手の会

シンポジウム1日目:8月30日(月)

[10:30-11:00] オープニング

[11:00-12:00] チュートリアル (1)

[12:00-13:30] 昼休憩

[13:30-15:00] ポスターセッション (1)

[15:00-15:30] 小休憩

[15:30-16:30] チュートリアル (2)

[16:30-17:00] 小休憩

[17:00-20:00] ラウンドテーブル(懇親会)

シンポジウム2日目:8月31日(火)

[10:30-12:00] ポスターセッション (2)

[12:00-13:30] 昼休憩

[13:30-15:00] ポスターセッション (3)

[15:00-15:30] 小休憩

[15:30-17:00] ポスターセッション (4)

[17:00-17:30] 小休憩

[17:30-18:00] ハッカソン発表

[18:00-18:30] クロージング

発表プログラム

8月30日(月)

チュートリアル (1) 11:00-12:00「Human-in-the-loop 機械学習」

講演者:馬場 雪乃 氏 (筑波大学 システム情報系)

馬場 雪乃 氏 講演概要:人間の知識や判断を取り入れるため,機械学習モデルの学習過程に効果的に人間を介在させるのが,Human-in-the-loop 機械学習である.クラウドソーシングの登場により,不特定多数の人々,すなわち群衆の参加による,Human-in-the-loop 機械学習の実践が容易になった.本チュートリアルでは,群衆から獲得した,誤りを含む教師ラベルを統合して,質の高い訓練データを作成する手法や,そのようなラベルから機械学習モデルを直接学習する手法を解説する.さらに,機械学習の様々な場面における群衆の活用方法も紹介する.

略歴:2012年東京大学大学院情報理工学系研究科にて博士(情報理工学)を取得.2012年東京大学大学院情報理工学系研究科特任研究員,2014年国立情報学研究所特任助教,2015年京都大学大学院情報学研究科助教を経て,2018年より筑波大学システム情報系准教授.ヒューマンコンピュテーション,機械学習の研究に従事.


ポスターセッション (1) 13:30-15:00

言語モデル・ニューラルネットワーク①

  • [P1-01] 数理最適ソルバを用いたテキスト判別モデルに対する敵対的サンプルの生成
    友成光(京大),西野正彬(NTT CS研),山本章博(京大)

  • [P1-02] 文法把握能力の高い言語モデルの多言語拡張に向けて - 現状と課題
    ○神藤駿介(東大/産総研),能地宏(産総研),宮尾祐介(東大)

  • [P1-03] 非線形モジュールの加法分解に基づくTransformerレイヤーの解析
    ○小林悟郎(東北大),栗林樹生(東北大/Langsmith),横井祥(東北大/理研),乾健太郎(東北大/理研)

誤り訂正①

  • [P1-04] 学習者データに対する擬似誤り生成を用いた文法誤り訂正モデルの分析
    ○小山碧海(都立大),金子正弘(東工大),小町守(都立大)

  • [P1-05] 事前学習モデルを用いた日本語文法誤りにおける局所訂正
    ○星野悠一郎(PKSHA),稲原宗能(PKSHA),田村陽平(PKSHA),渡邉陽太郎(PKSHA)

  • [P1-06] 文法誤りの訂正難易度の判別における人とシステムの一致調査
    ○五藤巧(NAIST),永田亮(甲南大/理研AIP),三田雅人(理研AIP/東北大)

  • [P1-07] 疑似データによるデータ拡張を行った文法誤り検出モデルの未知の誤りパターンに対する性能評価
    ○上田直生也(都立大),山下郁海(都立大),高橋悠進(都立大),平澤寅庄(都立大),小町守(都立大)

対話・読解①

  • [P1-08] 応答が困難な質問への適切な対応を可能とする対話システムの検討
    ○花尾理彩(大手前大),奥村紀之(大阪市立大学),本田直也(大手前大)

  • [P1-09] 数量推論モデルに対する人工データを活用した表層的な手がかりに頑健な評価法の検討
    ○工藤慧音(東北大),青木洋一(東北大),吉川将司(東北大/理研AIP),乾健太郎(東北大/理研AIP)

  • [P1-10] Wikipedia記事の構造化における関連知識を含む質問の有効性検証
    ○坂田将樹(北大),Rafal Rzepka(北大),荒木健治(北大)

  • [P1-11] オンライン会議の効率化に向けたリアルタイム対話要約における課題
    ○中村朝陽(東大),吉永直樹(東大)

応用 (Web)

  • [P1-12] Rustによる単語分割器の実装とWebAssemblyへの応用
    ○赤部晃一(LegalForce),髙橋諒(LegalForce),真鍋陽俊(LegalForce),小田悠介(LegalForce/東北大)

  • [P1-13] NLPの防災分野への適用 -防災分野はNLPのグランドチャレンジになれるか-
    ○萩行正嗣(WNI)

  • [P1-14] 訴求軸を考慮した広告文の作成支援に向けた訴求表現の抽出
    ○村上聡一朗(サイバーエージェント/東工大),張培楠(サイバーエージェント),星野翔(サイバーエージェント),上垣外英剛(東工大),高村大也(産総研),奥村学(東工大)

  • [P1-15] 文章の書き手が持つ感情と読み手が受ける感情の差に関する初期調査および考察
    ○中川翼(法政大),北田俊輔(法政大),彌冨仁(法政大)

  • [P1-16] Big Fiveによる性格検査とソーシャルメディアでの発言履歴を用いた鬱傾向の予兆検知
    ○安積佑和(大手前大),奥村紀之(大阪市立大),本田直也(大手前大)

  • [P1-17] 旅館予約サイトを対象としたレビュー文の自動カテゴリ分類
    ○髙師遥(都市大),阿部遥佳(都市大),蒲生奏衣(都市大).高貴達之(都市大),延澤志保(都市大)

  • [P1-18] 効果の高いランディングページ作成支援に向けた広告テキストからの効果予測および推薦モデルの構築
    ○北田俊輔(法政大),岩崎祐貴(サイバーエージェント),富樫陸(サイバーエージェント),山口光太(サイバーエージェント),彌冨仁(法政大)

チュートリアル (2) 15:30-16:30「Back to the noisy channel」

講演者:渡辺 太郎 氏 (奈良先端科学技術大学院大学 先端科学技術研究科)

渡辺 太郎 氏 講演概要:ニュラルネットワークで実現されたニューラル機械翻訳は,条件付きの言語モデルとして実現されており,学習データを忠実に再現する.そのため,データの偏りや誤りなどの影響を受けやすく,エラーの分析が容易ではない.これに対し,統計的機械翻訳は雑音のある通信路モデルで実現している.この枠組では,入力を生成する,あるいは,説明する,といったモデル化が行われており,学習データの誤りに対しても頑健なシステムが実現されてきた.本講演では,雑音のある通信路モデルや生成モデルをニューラル機械翻訳へ応用した研究を紹介する.

略歴:1994年京都大学工学部情報工学科卒業.1997年京都大学大学院工学研究科情報工学専攻修士課程修了.2000年Language and Information Technologies, School of Computer Science, Carnegie Mellon University, Master of Science取得.2004年京都大学博士(情報学).ATRおよびNTT, NICTにて研究員,また,グーグルでソフトウェアエンジニアとして勤めた後,2020年より奈良先端科学技術大学院大学教授.自然言語処理や機械学習,機械翻訳の研究に従事.

ラウンドテーブル(懇親会) 17:00-20:00

本シンポジウムでは,参加者間の相互交流を促す企画としてラウンドテーブルを開催します. テーブル毎にトピックを定め,同じ興味を持った参加者が組織や研究室,業種にとらわれず気軽に雑談・交流できる場を設けます.
例えば,以下のようなトピックを用意する予定です.

  • 進路,キャリア相談
  • 論文執筆のコツ
  • 面白かった一般発表について語り合いたい

トピックにより,少人数でテーブルの割り当てを行います.同じトピックに興味のある様々な方とお話しできるように,テーブルの割り当ては複数回行う予定です.

8月31日(火)

ポスターセッション (2) 10:30-12:00

言語モデル・ニューラルネットワーク②

  • [P2-01] 金融ドメインの事前学習BERTモデルの構築に向けて
    ○鈴木雅弘(東大),坂地泰紀(東大),平野正徳(東大),和泉潔(東大)

  • [P2-02] QAタスクにおけるGPTの性差別的バイアスの評価及びプロンプトを用いたバイアス除去手法の検討
    ○蘆田真奈(都立大),金子正弘(東工大),平澤寅庄(都立大),小町守(都立大)

  • [P2-03] chiTra: Sudachiによる日本語事前学習モデルの公開に向けて
    ○山村崇(ワークス),勝田哲弘(ワークス),髙岡一馬(ワークス),内田佳孝(ワークス),岡照晃(国語研),浅原正幸(国語研)

  • [P2-04] ニューラル言語モデルによる一対多関係知識の表現と獲得
    ○長澤春希(東北大),Benjamin Heinzerling(理研/東北大),乾健太郎(東北大/理研)

  • [P2-05] BERTの世界知識はどこにある?学習済み言語モデルにおける知識の局所性を解明する
    ○有山知希(東北大),Benjamin Heinzerling(理研/東北大),乾健太郎(東北大/理研)

言語資源・アノテーション

  • [P2-06] 日本語版GLUE構築に向けて
    ○栗原健太郎(早大),河原大輔(早大),柴田知秀(ヤフー)

  • [P2-07] 数式グラウンディングの自動化に向けて
    ○朝倉卓人(東大),宮尾祐介(東大),相澤彰子(NII)

  • [P2-08] MediAコーパス:ソーシャルメディアにおける服薬に関する不適切な認識コーパスの構築
    ○西山智弘(NAIST),荒牧英治(NAIST)

機械翻訳・系列変換①

  • [P2-09] 日本語の膠着語的性質を考慮したマルチタスク学習によるニューラル機械翻訳
    ○西田悠人(豊橋技科大),秋葉友良(豊橋技科大),塚田元(豊橋技科大)

  • [P2-10] Towards Detecting Errors of Chat Translation: Evaluating Translated Chat with Classifiers and Building Auto-Evaluatable Translation Chat System
    ○李云蒙(東北大),阿部香央莉(東北大),徳久良子(東北大),森下睦(NTT/東北大),鈴木潤(東北大/理研),乾健太郎(東北大/理研)

  • [P2-11] Transformerに適した日本語Data Augmentationツールの実現に向けて
    ○小原百々雅(日本女子大),秋信有花(日本女子大),倉光君郎(日本女子大)

誤り訂正②

  • [P2-12] 日本語文法誤り訂正の参照文を用いない自動評価における人手評価への最適化
    ○鈴木大祐(都立大),高橋悠進(都立大),山下郁海(都立大),相田太一(都立大),平澤寅庄(都立大),小町守(都立大)

  • [P2-13] Prompting を用いた GPT による文法誤り訂正の検討とその分析
    ○中辻充恭(都立大),山下郁海(都立大),高橋悠進(都立大),平澤寅庄(都立大),小町守(都立大)

  • [P2-14] 日本語学習者支援のための敬語誤り訂正タスクの提案
    ○北山晃太郎(東北大),松本悠太(東北大),舟山弘晃(東北大/理研),松林優一郎(東北大/理研),三田雅人(理研/東北大),乾健太郎(東北大/理研)

応用 (教育)

  • [P2-15] 学習段階のみでソースコードを用いた問題文からの段階的プログラムコメント生成
    ○大西朔永(岡山理大),椎名広光(岡山理大)

  • [P2-16] 訂正前後の情報を活用した解説文生成手法の検討
    ○地道邦顕(甲南大),永田亮(甲南大/JSTさきがけ),塙一晃(理研/東北大)

  • [P2-17] ソースコードとソースコード解説文のAlignmentの実現に向けて
    ○田村みゆ(日本女子大),秋信有花(日本女子大),髙野志歩(日本女子大),倉光君郎(日本女子大)

  • [P2-18] readability.jp : 教育的説明性の観点からの様々なリーダビリティ判定の比較
    ○江原遥(東京学芸大)

ポスターセッション (3) 13:30-15:00

埋め込み表現①

  • [P3-01] 指数型分布族による単語分散表現の特徴付け
    ○大山百々勢(京大),横井祥(東北大/理研AIP),下平英寿(京大/理研AIP)

  • [P3-02] 単語頻度を考慮した埋込空間の白色化の効能
    ○横井祥(東北大/理研),下平英寿(京大/理研)

  • [P3-03] テンソル表現による知識を用いて論理計算を行う質問応答に向けて
    ○村山友理(お茶大),小林一郎(お茶大)

情報抽出・意味解析・要約①

  • [P3-04] 事前学習済み言語モデルを用いた階層分類体系の自動拡張
    ○竹岡邦紘(NEC),秋元康佑(NEC),小山田昌史(NEC)

  • [P3-05] 文書単位関係グラフ抽出のための反復的な辺編集と編集履歴の利用
    ○牧野晃平(豊田工大),三輪誠(豊田工大),佐々木裕(豊田工大)

  • [P3-06] 文書情報を要約したナレッジグラフの生成とその課題
    ○星野智紀(NAIST),大内啓樹(NAIST),渡辺太郎(NAIST)

  • [P3-07] 特許構成要件オントロジー構築のための半教師あり情報抽出手法の開発
    ○作本猛(長岡技大),野中尋史(長岡技大)

  • [P3-08] 候補要約全体を考慮する抽出型要約における候補要約のスコアリング方法の分析
    ○川畑輝(NAIST),大内啓樹(NAIST/理研),渡辺太郎(NAIST)

対話・読解②

  • [P3-09] コンテキストを考慮したオープンドメイン対話システムの自動評価尺度の提案
    ○三林亮太(兵庫県立大),王亜楠(KDDI),大島裕明(兵庫県立大)

  • [P3-10] 応答の自動評価モデルとそれを利用した対話システム
    ○榮田亮真(早大),河原大輔(早大)

  • [P3-11] 傾聴対話システムにおけるミラーリング効果の検証
    ○水谷林太郎(中央大),鈴木寿(中央大)

  • [P3-12] プログラミング初学者に寄り添う対話システム
    ○富岡真由(日本女子大),秋信有花(日本女子大),髙野志歩(日本女子大),倉光君郎(日本女子大)

  • [P3-13] 雑談対話における会話への関心度と継続可能性を考慮した自動評価手法
    ○蔦侑磨(東大),吉永直樹(IIS),佐藤翔悦(IIS),豊田正史(IIS)

応用 (科学)

  • [P3-14] 複数文献中の変数の同義性判定手法の開発
    ○金上和毅(京大),加藤祥太(京大),加納学(京大)

  • [P3-15] 計算機代数システムを用いた数式群の同義性判定手法
    ○張純朴(京大),加藤祥太(京大),金上和毅(京大),加納学(京大)

  • [P3-16] 製造プロセスの物理モデルを文献から自動生成するAIの開発
    ○加藤祥太(京大),金上和毅(京大),張純朴(京大),加納学(京大)

  • [P3-17] 形式意味論と定理証明支援系をもちいた議論の形式化
    ○田尻健斗(筑波大)

ポスターセッション (4) 15:30-17:00

埋め込み表現②

  • [P4-01] 量子論理に基づく単語埋込集合間の論理演算
    ○石橋陽一(NAIST),横井祥(東北大/理研),須藤克仁(NAIST/JSTさきがけ),中村哲(NAIST)

  • [P4-02] PubMedの文献アブストラクト用いた単語埋め込み
    ○橋本竜馬(京大),下平英寿(京大/理研)

  • [P4-03] 文脈化埋め込みを用いた言語学習者のための語義別例文検索システム
    ○Joshua Tanner(東大/ワシントン大),吉永直樹(東大)

  • [P4-04] Self-AttentionとFused Gromov–Wasserstein距離に基づく文類似度計算
    ○山際宏明(京大),横井祥(東北大/理研),下平英寿(京大/理研)

  • [P4-05] Pre-trained Transformerによる引用文脈を考慮した引用ネットワーク埋め込み
    ○大萩雅也(東大),相澤彰子(NII)

機械翻訳・系列変換②

  • [P4-06] 古い小説から現代の常識に適合する近代文学の表現変換
    ○小川美彩季(大手前大),奥村紀之(大阪市立大),本田直也(大手前大)

  • [P4-07] 構文の複雑さに注目したテキスト平易化
    ○早川明男(NAIST),大内啓樹(NAIST),渡辺太郎(NAIST)

  • [P4-08] 軸言語で偽パラレルコーパスの構築による論文スタイルテキスト変換
    ○李笑然(静理工科),高野敏明(静理工科)

情報抽出・意味解析・要約②

  • [P4-09] Transformerを用いたテンプレートマッチング型による情報抽出
    ○梶浦照乃(日本女子大),秋信有花(日本女子大),倉光君郎(日本女子大)

  • [P4-10] 情報量に基づく日本語項省略の分析
    ○石月由紀子(東北大),栗林樹生(東北大/Langsmith),松林優一郎(東北大/理研),大関洋平(東大/理研)

  • [P4-11] 言語学的メタファー同定理論を利用したメタファー検出
    ○芳沢久志(NAIST)

  • [P4-12] 外国語レシピからのアレルゲン自動検出
    ○大坪愛佳(都市大),アルハビブファティマ(都市大),大和矢悠仁(都市大),延澤志保(都市大)

  • [P4-13] 日本語レシピを対象としたハラル推定
    ○アルハビブファティマ(都市大),大坪愛佳(都市大),延澤志保(都市大)

マルチモーダル

  • [P4-14] ビジネス電話応対における音声言語処理
    ○山内健二(RevComm),石塚賢吉(RevComm)

  • [P4-15] 模範解答を用いた画像描写問題の自動採点方法の調査
    ○山上晃右(甲南大),永田亮(甲南大),南條浩輝(京大)

  • [P4-16] Visually-guided machine translation by grounding input words to the world via images
    ○姚望(東大),吉永直樹(東大/IIS)

  • [P4-17] 言語モデルの一般化に向けた行動系列としての文書読解の事前学習の試作
    ○壹岐太一(総研大/NII),相澤彰子(NII)

  • [P4-18] 単語分散表現と音素列に基づく音声認識誤りに頑健な教師なし Entity linking
    ○邊土名朝飛(AI Shift),友松祐太(AI Shift),杉山雅和(AI Shift),戸田隆道(AI Shift),東佑樹(AI Shift)

NLP若手の会 (YANS) 第16回シンポジウム (2021)

NLP 若手の会

NLP 若手の会は,自然言語処理,計算言語学および関連分野の,若手研究者および技術者の学問研究および技術開発の促進をはかり,参加者の相互交流および成長の場を提供し,培われた学問研究および技術開発の成果が実社会に応用されることを奨励し,この分野の学問および産業の進歩発展に貢献することを目的として,年に1度,研究シンポジウムを開催しています.

本シンポジウムを通して密な議論を行う機会を設けるとともに,組織や研究室,業種を横断する幅広いつながりを醸成する機会を設けます.2019年には202名,2020年には334名の参加があり,多数の学生・若手研究者との交流が期待できます.今年はチュートリアルとして,馬場雪乃氏と渡辺太郎氏をお招きし「Human-in-the-loop 機械学習」と「Back to the noisy channel」をご講演いただきます.また,特定の評価メトリックを用いたコンペ形式のハッカソンを企画しています.

昨年に引き続き,今年も新型コロナウイルス感染症に関する状況を鑑み,オンラインで開催いたします.

更新情報

  • 参加費の課税について訂正しました (2021/09/03) new!
  • 参加申し込みを終了しました (2021/08/27)
  • ハッカソンのページにハッカソン内容の説明を追加しました(2021/08/13)
  • プログラムを公開しました (2021/08/05)
  • 発表申し込みを終了しました (2021/07/21)
  • 発表・事前参加申し込みを開始しました (2021/07/01)
  • ハッカソンのページを公開しました (2021/07/01)
  • シンポジウムの詳細を掲載しました (2021/07/01)
  • シンポジウムの開催概要を掲載しました (2021/06/12)

開催日

2021年8月30日(月),31日(火)

開催地

オンライン開催

参加費

参加費(不課税 税込み)は以下の通りです.

学生 社会人
早期
2021年7月1日(木)00:00 - 2021年7月16日(金)15:00
1,500円 3,000円
通常
【発表参加】2021年7月16日(金)15:00 - 2021年7月21日(水)15:00 ※
【聴講参加】2021年7月16日(金)15:00 - 2021年8月20日(金)15:00
2,000円 5,000円
直前
2021年8月20日(金)15:00 - 2021年8月27日(金)15:00
3,000円 6,000円

※ プログラム編成作業の都合上,聴講参加の場合よりも早い締切となっていますのでご注意ください.

プログラム

概要

  • 一般発表(ポスター)
  • チュートリアル
    • 馬場 雪乃 氏(筑波大学):「Human-in-the-loop 機械学習」
    • 渡辺 太郎 氏(NAIST):「Back to the noisy channel」
  • ハッカソン
  • ラウンドテーブル(懇親会)

シンポジウムの各プログラムにはGather.townとZoomを使用します.

プログラム詳細

NLP若手の会 (YANS) 第16回シンポジウム プログラム - NLP 若手の会

発表募集要項

これから始まる,または始まったばかりの研究の発表を歓迎します.本シンポジウムでの活発な議論を通じて,研究の進展を促進することを目指します.

発表テーマ

  • 自然言語処理・計算言語学
  • テキストマイニング
  • 音声言語処理
  • 人工知能
  • その他関連分野

発表資格

参加者の相互交流および成長の場を提供するという趣旨に照らし,特に学生および博士収得後8年以内の参加者の発表を推奨いたします.自然言語処理および関係分野の研究を始めたばかりの方の発表や,始まったばかりの研究(未完成の研究)に関する発表を奨めます.発表申込に際し,特定の学会に所属している必要はございません.

発表形式

本シンポジウムでは,ポスター発表を募集いたします.ツールはGather.townを使用します. ポスターは横置きのJPGかPNGファイルとして作成してください.

発表申込方法

「事前参加登録」の欄の「事前参加登録システム」より,申し込みをお願いいたします.
なお,原則全てのお申し込みを受け付けますが,以下の点などにより,ご発表をご遠慮いただく場合があります.この場合,個別にご案内いたします.

  • 本シンポジウムの開催趣旨から大きく逸脱する発表はご遠慮いただく場合があります.
  • 申込が多数となった場合は未発表および早期申込の発表を優先する場合があります.

参加募集要項

本シンポジウムでは,聴講のみの参加も受け付けています. 自然言語処理および関係分野に興味を持ち始めたばかりの方の参加を歓迎いたします. 「事前参加登録」の欄の「事前参加登録システム」より,申し込みをお願いいたします. なお,原則全てのお申し込みを受け付けますが,申込が多数となった場合は早期申込の方を優先し,参加募集を打ち切る可能性があります.

事前参加登録(参加・発表)

※ 発表申込,参加申込は終了しました
発表申込期間:2021年7月1日(木)00:00 - 2021年7月21日(水)15:00
参加申込期間:2021年7月1日(木)00:00 - 2021年8月27日(金)15:00

スケジュール(予定)

  • 発表申込開始:2021年7月1日(木)
  • 参加申込開始:2021年7月1日(木)
  • シンポジウム:2021年8月30日(月),31日(火)

主催

NLP 若手の会
NLP 若手の会運営委員会

NLP 若手の会第16回シンポジウム運営委員

委員長
- 高瀬 翔 (東工大)
- 萩行 正嗣 (ウェザーニューズ)

委員
- 久保 隆宏 (TIS株式会社)
- 中山 祐輝 (楽天技術研究所)
- 丹羽 彩奈 (東工大)
- 濵園 侑美 (お茶大)
- 平澤 寅庄 (都立大)
- 舟木 類佳 (株式会社LegalForce)
- 阿部 香央莉 (東北大)
- 大杉 康仁 (NTT MD研)
- 高山 隼矢 (阪大)
- 中村 優太 (東大)
- 人見 雄太 (Insight Edge)
- 平野 正徳 (東大)
- 三浦 泰嗣 (リクルートライフ)
- 村山 友理 (お茶大)

顧問
- 井之上 直也 (Stony Brook University)

お問い合わせ

NLP 若手の会第16回シンポジウム運営委員会 yans2021committee (at) googlegroups.com