2023年8月30日(水)〜31日(木),浅草橋ヒューリックホール(東京都台東区)にてNLP若手の会第18回シンポジウム(YANS2023)を開催しました。 YANS2019以来となる4年ぶりの現地開催となり,300名(学生156名,社会人144名)の参加と140件の発表(学生95件,社会人45件),20社のスポンサーの皆様をむかえ,今年も大盛況でした。 ご参加いただいた皆様,ご支援いただいた皆様,どうもありがとうございました。
本シンポジウムでは,優秀な研究発表に対して奨励賞,デモ賞,スポンサー賞を授与しました。奨励賞はこれから始まる,または始まったばかりの研究を奨励することを主旨とするものであり,現時点の研究の完成度よりもアイデアの面白さ,及び新規性や発展性への期待を重視します。奨励賞およびデモ賞の選考は参加者による投票をもとに,最終的には表彰担当者による合議によって奨励賞は20件,デモ賞は1件を選出しました。スポンサー賞は産学交流の一環として各スポンサー独自の視点から受賞者を選出していただきました。いずれの賞も受賞者は筆頭著者のみとなります。
今年のチュートリアルでは,東京大学の松井勇佑氏に「グラフを用いた近似最近傍探索の理論と応用」を,理化学研究所・NAISTの吉野幸一郎氏に「その研究ChatGPTでいいんじゃないですか?~LLM時代の対話システム研究~」をご講演いただきました。また,招待セッションでは自然言語処理や音声音響,画像,ロボティクス分野でご活躍されている若手研究者/技術者17名をお招きし,これまでのご自身の研究についてポスター発表をしていただきました。
シンポジウムの前日には,分野交流ハッカソンも開催されました.本ハッカソンでは,昨今の生成AIの登場を背景として,画像生成や言語生成の可能性を探るテーマが設定されました。具体的には,OpenAI APIを利用したデモアプリ開発ハッカソンおよびリーダーボードハッカソンが開催されました。ハッカソンには51名が参加し,各テーマについて6チームずつ,計12チームが取り組みました。 シンポジウムのクロージングでは受賞チームによる最終成果発表を行い,優秀賞および審査員特別賞が贈られました。
シンポジウムの様子
0日目(2023/8/29)
シンポジウム前日(0日目)には分野交流ハッカソンが開催されました。 本ハッカソンではOpenAI APIを利用した,デモアプリ開発ハッカソンとリーダーボードハッカソンを行いました。 デモアプリ開発ハッカソンでは,言語と画像のマルチモーダルな入出力を行うWebアプリの開発, リーダーボードハッカソンでは,商材の説明文書や検索キーワードを用いた広告文生成に取り組みました。
1日目(2023/8/30)
4年ぶりの現地開催となった今年のシンポジウムは東京都台東区の浅草橋ヒューリックホールで開催され,300名という多くの方々にご参加いただきました。 1日目では東京大学の松井先生によるグラフを用いた近似最近傍探索に関するチュートリアルやポスター発表に加え,ラウンドテーブルやスポンサーセッション,YANSスペシャルセッションなど多くの企画が行われました!
2日目(2023/8/31)
2日目のチュートリアルでは,理化学研究所・NAISTの吉野先生よりLLM時代の対話システム研究についてご発表していただきました。 2日目も1日目に引き続き,多くのポスター発表があり,各所で熱心に研究の議論が交わされる場面が見られました。 また招待セッションでは,自然言語処理や音声音響,画像,ロボティクス分野で活躍されている若手研究者/技術者の方々にご自身の研究について発表していただきました。
統計データ
参加登録数の推移
2019年以来となる4年ぶりの現地開催となりましたが,300名と数多くの方にご参加いただきました。 また,今年の参加者全体における学生・社会人の割合は同程度となりました。
発表件数の推移
今年は昨年の2倍以上となる140件の発表がありました。これまでのNLP若手の会シンポジウムにおいて過去最多の発表件数です。
発表者の内訳
140件の発表のうち,学生は95件(全体の約7割),社会人は45件(全体の約3割)の発表がありました。
参加報告ブログの紹介
今回のシンポジウムにご参加いただいた多くの方からも参加報告ブログを書いて頂きました。 ぜひ、学生や企業の方など様々な参加者の皆さまが本シンポジウムで感じた生の感想やレポートもあわせてご覧ください。
発表資料等
オープニング・クロージング
オープニング資料
クロージング資料
チュートリアル
松井 勇佑氏(東京大学):グラフを用いた近似最近傍探索の理論と応用
吉野 幸一郎 氏 (理化学研究所 / 奈良先端科学技術大学院大学):その研究ChatGPTでいいんじゃないですか?~LLM時代の対話システム研究~」
招待セッション
タイトル | 発表者 | 資料 |
---|---|---|
言葉のニュアンスを計算する | 赤間 怜奈 氏(東北大学) | ー |
環境音の分析・合成と自然言語処理との交差点 | 井本 桂右 氏(同志社大学) | |
大学と企業での研究経験から学んだこと | 宇田川 拓真 氏(日本IBM) | |
認知モデリングと自然言語処理 | 大関 洋平 氏(東京大学) | |
評価の研究について | 大谷 まゆ 氏(サイバーエージェント) | |
言語モデルの公平性 | 金子 正弘 氏(MBZUAI / 東京工業大学) | |
大規模言語モデルの実ロボットタスク応用 | 河原塚 健人 氏(東京大学) | |
実世界を認識して動作するための言語理解技術 | 栗田 修平 氏(理化学研究所) | |
未見の環境およびタスクにおける大規模事前学習済み モデルからの効率的な知識転移手法に関する研究 |
小島 武 氏(東京大学) | |
言語と世界の機械学習 | 小林 颯介 氏(Preferred Networks / 東北大学) | ー |
えるえるえむ時代の言語理解の評価について | 菅原 朔 氏(国立情報学研究所)- [ご都合により欠席] | ー |
日本語質問応答研究に対して私が出した「答案」 | 鈴木 正敏 氏(Studio Ousia / 東北大学) | ー |
開発部と基礎研究所から見た対話システム研究 | 角森 唯子 氏(NTTコミュニケーション科学基礎研究所 / 名古屋大学) | |
説明文生成を用いた動作行動予測 | 中村 泰貴 氏(東京大学 / Parakeet) | |
コーパスアノテーションと言語現象の体系化の試み | 東山 翔平 氏(情報通信研究機構 / 奈良先端科学技術大学院大学) | ー |
ロボットから人の知能の謎を解き明かす | 村田 真悟 氏(慶應義塾大学) | ー |
日英機械翻訳を世界に浸透させるために行った3つのこと | 森下 睦 氏(NTTコミュニケーション科学基礎研究所) |
ハッカソン
ハッカソンの概要
デモアプリ開発ハッカソン
チーム名 | 発表資料 |
---|---|
チーム1 (エルゴベイズ量子麺) | |
チーム2 (Trans4mer) | |
チーム3 (yansハッカソン2023チーム3.ipynb) | |
チーム4 (ブルボンズ) | |
チーム5 (はらぺこ) | |
チーム6 (大喜利マスターズ) |
リーダーボードハッカソン
チーム名 | 発表資料 |
---|---|
チームA (Ghost Writers) | |
チームB (Input: ハッカソンの\"Team B\" のチーム名を考えてください Output: B-Force) |
|
チームC (半分遅刻) | |
チームD (四人寄ればROUGEの知恵) | |
チームE (チームみがわり) | |
チームF (復活のF) |
受賞者
本シンポジウムでは全140件の発表に対して,1件のデモ賞,20件の奨励賞,12件のスポンサー賞が授与されました。 また分野交流ハッカソンでは,デモアプリ開発ハッカソンとリーダーボードハッカソンにおいて2件の優秀賞,2件の審査員特別賞が授与されました。
デモ賞
- 文章から地図へ:テキストジオグラウンディングシステムの開発
◯中谷響 (NAIST),寺西裕紀 (理研/NAIST),東山翔平 (NICT/NAIST),大内啓樹 (NAIST/理研),渡辺太郎 (NAIST)
奨励賞
- JGLUEによる事前学習済み日本語LLMの日本語理解能力の評価
◯林崎由 (東北大),能勢隆 (東北大),伊藤彰則 (東北大) - 専門家が平易化した記事を用いたやさしい日本語パラレルコーパスの構築
◯宮田莉奈 (愛媛大),惟高日向 (愛媛大),山内洋輝 (愛媛大),柳本大輝 (愛媛大),梶原智之 (愛媛大),二宮崇 (愛媛大),西脇靖紘 (MATCHA) - 打ち言葉に特化させた学習手法を用いた親密度推定モデル
◯仲田明良 (静大),狩野芳伸 (静大) - 雑談対話にキャラクタ性を付与するためのスタイル変換
◯近藤里咲 (愛媛大),梶川怜恩 (愛媛大),梶原智之 (愛媛大),二宮崇 (愛媛大) - 大規模言語モデルによる和文英訳問題の自動採点の評価と応用可能性の検討
◯三浦直己 (東北大),岩瀬裕哉 (東北大),舟山弘晃 (東北大),松林優一郎 (東北大) - テキストに基づくダイアグラム生成タスクの提案
◯吉田遥音 (東北大),工藤慧音 (東北大),青木洋一 (東北大),坂口慶祐 (東北大/理研) - ChatGPTは優れた教師になれるのか?
◯郷原聖士 (NAIST),上垣外英剛 (NAIST),渡辺太郎 (NAIST) - 三言語モデル寄れば文殊の知恵を
◯稲葉達郎 (京大),藤井巧朗 (横国大),小原涼馬 (北大),柴田幸輝 (筑波大) - 珍妙で面白いWikipedia記事の発見手法
◯多田智貴 (北大),林克彦 (北大),上垣外英剛 (NAIST) - 生成応答に含まれる事実に基づかない情報の自動検出の試み
◯亀井遼平 (東北大),塩野大輝 (東北大),赤間怜奈 (東北大/理研),鈴木潤 (東北大/理研) - kNN-LMによる知識グラフを用いた大規模言語モデルにおける知識の操作
◯林和樹 (NAIST),出口祥之 (NAIST),Xincan Feng (NAIST),上垣外英剛 (NAIST),林克彦 (北大),渡辺太郎 (NAIST) - 内部表現の幾何に基づく言語モデルの解釈
◯大山百々勢 (京大/理研),山際宏明 (京大),石橋陽一 (京大),下平英寿 (京大/理研) - 家庭内ロボットの気の利いた行動の実現に向けて
◯山﨑康之介 (NAIST/理研),田中翔平 (OSX),河野誠也 (理研/NAIST),湯口彰重 (東京理科大/理研),吉野幸一郎 (理研/NAIST) - HojiChar: テキスト処理パイプライン
◯新里顕大 (京大/LINE),清野瞬 (LINE),高瀬翔 (LINE),小林滉河 (LINE),佐藤敏紀 (LINE) - LoRAを用いた大規模多言語文埋め込みモデルの構築
◯矢野千紘 (名大),福地成彦 (PKSHA),深澤笙子 (PKSHA),橘秀幸 (PKSHA),渡邉陽太郎 (PKSHA) - knn-seq: 高速・拡張可能なkNN機械翻訳フレームワーク
◯出口祥之 (NAIST/NICT),平野颯 (NAIST),星野智紀 (NAIST),西田悠人 (NAIST),Justin Vasselli (NAIST),渡辺太郎 (NAIST) - 日本語インストラクションデータセットの構築とその適用による大規模言語モデルのチューニング
◯鈴木雅弘 (東大),平野正徳 (東大),坂地泰紀 (東大) - 日本語文書レベル関係抽出コーパスの構築
◯Youmi Ma (東工大),An Wang (東工大),岡崎直観 (東工大) - 大規模言語モデルへの不適切な入力に関する研究
◯大賀悠平 (NTT),長谷川拓 (NTT),西田京介 (NTT),齋藤邦子 (NTT) - 日本語LLMベンチマーク構築に向けて
◯栗原健太郎 (AI Shift),佐々木翔大 (サイバーエージェント),張培楠 (サイバーエージェント),石上亮介 (サイバーエージェント),三田雅人 (サイバーエージェント),加藤明彦 (サイバーエージェント)
スポンサー賞
サイバーエージェント賞
- 生成応答に含まれる事実に基づかない情報の自動検出の試み
◯亀井遼平 (東北大), 塩野大輝 (東北大), 赤間怜奈 (東北大/理研), 鈴木潤 (東北大/理研) - 知識の提供という側面から見たスポーツ実況中継の分析
◯森雄一郎 (東工大),前川在 (東工大),小杉哲 (東工大),船越孝太郎 (東工大),高村大也 (産総研),奥村学 (東工大/理研)
PKSHA Technology賞
- 敵対的事例を用いたIn-context learningによるLLM生成エッセイの検出
◯小池隆斗 (東工大),金子正弘 (MBZUAI/東工大),岡崎直観 (東工大)
リクルート賞
- 会話の含みへの対応における人間と言語モデルの比較
◯小方雅子 (早大),中下咲帆 (早大),藤後英哲 (早大),菊池英明 (早大),藤倉将平 (サイシキ)
Helpfeel賞
- 日本語学習のための形態意味中心の動詞活用
◯松﨑孝介 (東北大),谷口雅弥 (理研),坂口慶祐 (東北大/理研),乾健太郎 (東北大/理研)
博報堂テクノロジーズ賞
- 敵対的事例を用いたIn-context learningによるLLM生成エッセイの検出
◯小池隆斗 (東工大),金子正弘 (MBZUAI/東工大),岡崎直観 (東工大)
シェルパ・アンド・カンパニー賞
- 巡回ホログラフィック縮退表現による大規模マルチラベル分類の効率化
◯西田拳 (北大),林克彦 (北大),上垣外英剛 (NAIST)
くふうカンパニー賞
- 専門家が平易化した記事を用いたやさしい日本語パラレルコーパスの構築
◯宮田莉奈 (愛媛大),惟高日向 (愛媛大),山内洋輝 (愛媛大),柳本大輝 (愛媛大),梶原智之 (愛媛大),二宮崇 (愛媛大),西脇靖紘 (MATCHA)
ELYZA賞
- 日本語インストラクションデータセットの構築とその適用による大規模言語モデルのチューニング
◯鈴木雅弘 (東大),平野正徳 (東大),坂地泰紀 (東大)
LLM-X賞
- 語彙内トークンを媒介とした大規模言語モデルへのソフトプロンプトの転移
◯中島京太郎 (都立大),金輝燦 (都立大),平澤寅庄 (都立大),岡照晃 (一橋大),小町守 (一橋大)
エクサウィザーズ賞
- 対話モデルの生成確率の変動を用いた小学校の授業における発話の影響度分析
◯大西朔永 (岡山理大),椎名広光 (岡山理大),保森智彦 (岡山理大)
ちゅらデータ賞
- 有価証券報告書のPDFに含まれる表を対象にした構造解析の試み
◯佐藤栄作 (小樽商大),木村泰知 (小樽商大)
ハッカソン賞
デモアプリ開発ハッカソン 優秀賞
- チーム6 - 大喜利バスターズ
馬越雅人 (LINE),加藤大地 (東大),亀井遼平 (TohokuNLP),片山歩希 (NAIST)
リーダーボードハッカソン 優秀賞
- チームD - 四人寄ればROUGEの知恵
山本悠士 (東京理科大),和田有輝也 (LINE),郷原聖士 (NAIST),木山朔 (都立大)
デモアプリ開発ハッカソン 審査員特別賞
- チーム6 - 大喜利バスターズ
馬越雅人 (LINE),加藤大地 (東大),亀井遼平 (TohokuNLP),片山歩希 (NAIST)
リーダーボードハッカソン 審査員特別賞
- チームE - チームみがわり
山岸駿秀 (マネーフォワード),寺本大輝 (Helpfeel),小方雅子 (早大),林崎由 (東北大)