- 招待セッション
- 「言葉のニュアンスを計算する」 赤間 怜奈 氏(東北大学)
- 「環境音の分析・合成と自然言語処理との交差点」 井本 桂右 氏(同志社大学)
- 「大学と企業での研究経験から学んだこと」 宇田川 拓真 氏(日本IBM)
- 「認知モデリングと自然言語処理」 大関 洋平 氏(東京大学)
- 「評価の研究について」 大谷 まゆ 氏(サイバーエージェント)
- 「言語モデルの公平性」 金子 正弘 氏(MBZUAI / 東京工業大学)
- 「大規模言語モデルの実ロボットタスク応用」 河原塚 健人 氏(東京大学)
- 「実世界を認識して動作するための言語理解技術」 栗田 修平 氏(理化学研究所)
- 「未見の環境およびタスクにおける大規模事前学習済みモデルからの効率的な知識転移手法に関する研究」 小島 武 氏(東京大学)
- 「言語と世界の機械学習」 小林 颯介 氏(Preferred Networks / 東北大学)
- 「えるえるえむ時代の言語理解の評価について」 菅原 朔 氏(国立情報学研究所)- [ご都合により欠席]
- 「日本語質問応答研究に対して私が出した「答案」」 鈴木 正敏 氏(Studio Ousia / 東北大学)
- 「開発部と基礎研究所から見た対話システム研究」 角森 唯子 氏(NTTコミュニケーション科学基礎研究所 / 名古屋大学)
- 「説明文生成を用いた動作行動予測」 中村 泰貴 氏(東京大学 / Parakeet)
- 「コーパスアノテーションと言語現象の体系化の試み」 東山 翔平 氏(情報通信研究機構 / 奈良先端科学技術大学院大学)
- 「ロボットから人の知能の謎を解き明かす」 村田 真悟 氏(慶應義塾大学)
- 「日英機械翻訳を世界に浸透させるために行った3つのこと」 森下 睦 氏(NTTコミュニケーション科学基礎研究所)
招待セッション
「言葉のニュアンスを計算する」
赤間 怜奈 氏(東北大学)
概要: 自然言語処理の中核的な研究対象である言語の一次的側面(明示的な意味や統語情報等)を超えて、言語の非一次的側面(文体や語彙選択に現れる暗黙的な意図や文化等)をも計算機上で扱おうとする試みは、近年の自然言語処理における挑戦的な取り組みのひとつである。高性能な大規模言語モデルが出現した今日においても、表現の差異によってもたらされる微妙なニュアンスの違いを、計算機が正確に理解し自在に扱うことは依然として難しい。本発表では、言語の非一次的側面も考慮した繊細な言語理解・処理技術の実現に向けて我々がこれまでに取り組んできた研究を紹介するとともに、今後の展開の可能性についても議論したい。
略歴: 2017年東北大学工学部卒業。2018年東北大学大学院情報科学研究科博士前期課程短縮修了、2021年同博士課程短縮修了。2021年より東北大学データ駆動科学・AI教育研究センター助教、理化学研究所AIPセンター客員研究員。
「環境音の分析・合成と自然言語処理との交差点」
井本 桂右 氏(同志社大学)
概要: 音声や音楽に限らないあらゆる音を分析し,音の種類や発生時刻,発生状況を推定する技術は環境音分析と呼ばれている.また,環境音や効果音などあらゆる音を人工的に作り出し,ゲームや映画制作に活用する環境音合成技術も実現可能になりつつある.本発表では,環境音分析や合成技術の概要について紹介するとともに,最新の研究動向や課題について述べる.また,環境音分析・合成と自然言語処理との関わりについて紹介し,今後,両分野の研究者が協力して新たな取り組みを始めるためのきっかけを提供する.
略歴: 2010年京都大学大学院都市環境工学専攻修士課程修了。同年日本電信電話(株) 入社.2017年総合研究大学院大学複合科学研究科博士課程修了,博士(情報学).2017年立命館大学情報理工学部助教,2020年より同志社大学理工学部准教授,現在に至る.環境音分析,環境音合成,アレイ信号処理の研究に従事.
「大学と企業での研究経験から学んだこと」
宇田川 拓真 氏(日本IBM)
概要: 自然言語処理を含むAIの分野では大学と企業の産学連携が研究の大きな推進力となっている. 本発表では私が大学時代に従事した対話システムに関する基礎研究と, 企業の研究所にて従事した代表的な研究事例について紹介する. また, それらの経験を通じて私自身が学んだこと, 例えば大学と企業での研究に共通して重要なスキルや, 一方で特に重視されるスキルについて議論する. 本発表を通じて, 本格的な研究が未経験の方や, 大学・企業での一方の研究が未経験の方に役立つ情報が発信できれば幸いである.
略歴: 2021年東京大学情報理工学系研究科博士後期課程修了. 現在日本IBM東京基礎研究所研究員. 自然言語処理および音声言語処理, 特に対話システム・大規模言語モデル・音声認識に関する研究に従事.
「認知モデリングと自然言語処理」
大関 洋平 氏(東京大学)
概要: 人間の言語能力・言語処理を計算機上で再現するモデルの開発は、認知科学・人工知能の究極的な目標であり、解釈性・頑健性・効率性など深層学習に基づく自然言語処理の諸問題を解決する工学的なポテンシャルも秘めている。本発表では、人間らしい言語処理モデルを開発する研究分野である認知モデリングの概要と展望を紹介する。具体的には、記号・知識と深層学習を融合した言語モデル・構文解析器、認知・脳情報データで言語モデルを訓練・ファインチューニングするためのアルゴリズム、言語モデルの言語能力・言語処理を評価するためのベンチマークを概観する。加えて、認知モデリングの観点から昨今の大規模言語モデルが及ぼす学術的なインパクトについて議論する。
略歴: 東京大学大学院総合文化研究科講師、理化学研究所革新知能統合研究センター客員研究員。2010-2012年に北海道大学大学院国際広報メディア・観光学院でMAを取得、2012-2013年にマサチューセッツ大学アマースト校言語学科で訪問学生、2013-2018年にニューヨーク大学言語学科でPh.D.を取得。2018-2020年に早稲田大学理工学術院助教を経て、2020年から現職。計算言語学、認知科学の研究に従事。
「評価の研究について」
大谷 まゆ 氏(サイバーエージェント)
概要: 多くの研究では共有された評価方法において性能の改善を示すことが重視されているため、分野全体がその評価方法に適合していくことがある。そのような環境において、評価方法そのものに対する批判的な研究は分野の健全な発展のために重要である。本発表ではこれまで取り組んできた既存評価の分析や指標設計を紹介する。評価は分野よらず同種の課題があるので参加者とより良い評価を達成するためのアイディアについて議論したい。
略歴: 2018年に奈良先端科学技術大学院大学情報科学研究科博士後期課程修了後、サイバーエージェント入社。コンピュータビジョン、機械学習に関する研究に従事。
「言語モデルの公平性」
金子 正弘 氏(MBZUAI / 東京工業大学)
概要: ChatGPTの出現により言語モデルの利用は生活の一部になりつつある。一方で、言語モデルは公平性の観点から実社会において信頼して活用するにはまだまだ課題が山積している。本発表では、言語モデルに関する公平性の研究について紹介する。
略歴: 2021年東京都立大学において博士後期課程修了。2018年から2019年までリバプール大学客員研究員。2018年から2021年まで理化学研究所AIPセンター自然言語理解チームリサーチアシスタント。2021年から2023年まで東京都立大学客員研究員。2021年から2023年まで東京工業大学研究員。2022年カーネギー・メロン大学客員研究員。2023年7月より東京工業大学特別研究員。2023年7月よりMBZUAI研究員。
「大規模言語モデルの実ロボットタスク応用」
河原塚 健人 氏(東京大学)
概要: これまで自然言語処理とロボティクスの関わりは希薄であったが, 大規模言語モデルの発展により, その間に大きな接点が生まれつつある. 本ポスターでは, 大規模言語モデル・大規模視覚-言語モデルを実ロボットタスクへ応用する研究について, 現在取り組んでいるいくつかの事例を紹介する. VQAを用いた状態推定に基づくロボット行動生成, 全天球カメラとCLIP/Deticを用いた反射型ロボットナビゲーション, GPTによるレシピ解釈とCLIPによる連続状態認識を用いた料理ロボットへの応用, GPTによる動作計画とsmachに基づく生活支援タスク実行, GPTや感情モデルに基づく人とロボットの思い出共有システム構築などの事例から, 今後の自然言語処理とロボティクスの関係について議論したい.
略歴: 2022年東京大学大学院情報理工学系研究科知能機械情報学専攻博士課程修了. 博士(情報理工学). 2022年より東京大学大学院情報理工学系研究科特任助教. 筋骨格ヒューマノイドの身体設計と制御・深層学習に基づく知能ロボットシステムの研究開発に従事.
「実世界を認識して動作するための言語理解技術」
栗田 修平 氏(理化学研究所)
概要: 大規模言語モデルの活用などにより、テキストに閉じた自然言語処理・理解は大きな進歩を遂げつつある。しかし、テキストに閉じない実世界の対象、特に視覚や動作情報などと自然言語処理を組み合わせることは困難な課題である。本発表では、テキストの内容を実世界の対象と対応付けるグラウンディング技術について、その花形である参照表現理解やオープン語彙物体認識、発表者の最近の研究内容である動画データセット上で言語指示された物体を追跡する研究などを紹介する。また、言語指示に従って写実的な三次元環境でナビゲーションを行う研究や、ロボットを言語指示に従って動作させる最新の研究動向についても触れる予定である。
略歴: 2019年京都大学大学院情報学研究科黒橋・河原研究室博士課程修了.博士(情報学)(京都大学).2019年より独立行政法人理化学研究所革新知能統合研究センター特別研究員,2023年より同研究員.2020年よりニューヨーク大学訪問研究員.2020年よりJSTさきがけ研究者.実世界での自然言語理解,テキストを画像や3Dなどのモダリティと同時に捉えるための研究に従事.
「未見の環境およびタスクにおける大規模事前学習済みモデルからの効率的な知識転移手法に関する研究」
小島 武 氏(東京大学)
概要: 博士課程での研究では、未見の環境やタスクに対して大規模事前学習モデルから効率的な知識移転を行う3つの研究に取り組みました。1つ目と2つ目の研究は、テスト時における画像認識で教師ラベルのない状態で効率的なテスト時適応(Test-Time Adaptation)を行う手法を提案しました。3つ目の研究では、自然言語処理において、多段階の推論が必要なタスクにおいて大規模言語モデルのパフォーマンスを向上させるプロンプティング手法(Let's think step by step)を提案しました。現在、大規模言語モデルを事前学習からスクラッチで開発するプロジェクトに携わっており、このプロジェクトを通じて、今後、上記のような知識転移を可能とさせる要因を突き止める研究を行いたいと考えています。
略歴: 2023.3 東京大学大学院 工学系研究科 技術経営戦略学専攻 博士課程修了,博士(工学) / 博士論文:A Study on Efficient Knowledge Transfer from Large Pre-trained Models for Unseen Environments and Tasks(研究科長賞受賞) / 2023.4 - 東京大学大学院 工学系研究科 技術経営戦略学専攻 特任研究員
「言語と世界の機械学習」
小林 颯介 氏(Preferred Networks / 東北大学)
概要: 機械学習の懐は広い.数々の問題に簡単に適用でき,斬新奇抜なアイデアも受け入れることで進歩を遂げてきた.基盤モデルの発展により分野の垣根も低くなり,言語も有用な共通インターフェースとしての地位を確立している.本発表では,文章読解,言語モデル,コンピュータビジョンと参照表現理解,ニューラル場による三次元復元など,幅広いモダリティでのこれまでの機械学習研究を総覧する.そして,言語・画像・三次元空間などの異分野の融合例として,基盤モデルを用いて三次元空間を意味的に解析・分解する研究について詳しく述べる.
略歴: 2016年東北大学大学院情報科学研究科博士前期課程修了。同年,株式会社Preferred Networksに入社.2021年東北大学同研究科博士後期課程修了(情報科学).同年より東北大学データ駆動科学・AI教育研究センター学術研究員兼任.
「えるえるえむ時代の言語理解の評価について」
菅原 朔 氏(国立情報学研究所)- [ご都合により欠席]
概要: 自然言語処理では人間のように言語を理解するシステムを構築することがひとつの目標です。これまで様々な言語理解タスクが取り組まれ、最近はえるえるえむが目覚ましい性能を示していますが、その振る舞いを正確に評価する・説明することは容易ではありません。本発表では、とくに評価方法・説明性の観点から発表者がこれまで取り組んできたデータセット分析やベンチマーク構築の試みを紹介しながら、今後のシステム評価の発展の方向性を考えてみます。
略歴: 国立情報学研究所コンテンツ科学研究系助教。2020年3月東京大学大学院情報理工学系研究科博士課程修了。2020年4月より現職。博士(情報理工学)。
「日本語質問応答研究に対して私が出した「答案」」
鈴木 正敏 氏(Studio Ousia / 東北大学)
概要: 質問応答は自然言語処理における最重要の応用問題の一つであり、コンピュータの黎明期から研究が続けられている。特に近年は、深層学習技術の飛躍的な進展と、大規模なデータセットなどの言語資源の整備を背景に、質問応答の研究は世界的に盛り上がりを見せている。その一方、国内においては、利用可能なモデルやデータセットなどの資源が乏しく、研究があまり活発に行われていない状況が続いていた。本発表では、私がこれまでに取り組んできた、日本語のクイズを題材にした質問応答の研究と、それを可能にするために行った言語資源の構築について振り返るとともに、現在も実施に携わっている質問応答コンペティションの「AI王」について紹介する。
略歴: 2019年東北大学大学院情報科学研究科博士前期課程修了。2021年同博士後期課程修了。2021年より株式会社Studio Ousiaソフトウェアエンジニア、東北大学データ駆動科学・AI教育研究センター学術研究員。主に質問応答システムの研究・開発に従事。博士(情報科学)。
「開発部と基礎研究所から見た対話システム研究」
角森 唯子 氏(NTTコミュニケーション科学基礎研究所 / 名古屋大学)
概要: 企業における開発部と研究所の対話システム研究では,役割や重視される観点が異なる.開発部では研究成果がサービスに直結するというやりがいはあるものの,迅速性や利益性を重視して研究テーマを設定する必要がある.一方,研究所では研究者の興味や探求心が重視されるが,成果が出るまで長い期間を要することがあり,また成果がサービスに結びつくとは限らない.本発表では,開発部と基礎研究所で取り組んだ対話システム研究について,それぞれの違いを交えながら紹介する.
略歴: 2015年奈良先端科学技術大学院大学情報科学研究科博士前期課程修了.同年株式会社NTTドコモ入社.2020年より名古屋大学大学院情報学研究科博士後期課程在学中.2022年よりNTTコミュニケーション科学基礎研究所研究員.対話システムに関する研究開発に従事.
「説明文生成を用いた動作行動予測」
中村 泰貴 氏(東京大学 / Parakeet)
概要: 生活支援システムがどのような状況理解を行い、どのような動作行動の生成しようとしているかは、言語で表現することが重要である。そこで本研究では、現在の状況からシステムが行うべき行動を予測しその内容を言語で説明する、動作行動予測とその言語化に取り組む。具体的には、ある状況とそこに対して何らかの支援行動が行われた状況の画像を入力とし、どのような支援行動が行われたかを説明する言語化タスクによって動作行動予測を実現するシステムを構築した。この際、行われた支援行動に相当する動作のシーングラフ予測を補助タスクを用いることで、精度高く動作行動の予測・言語化を行うことができることが確認された。
略歴: 2022年東京大学大学院情報理工学系研究科修士課程修了. 同年より同大学院博士課程に在学.Parakeet 株式会社代表取締役.2022年言語処理研究会にて優秀研究賞を受賞.理化学研究所ガーディアンロボットプロジェクトでのインターン中,本研究を実施.
「コーパスアノテーションと言語現象の体系化の試み」
東山 翔平 氏(情報通信研究機構 / 奈良先端科学技術大学院大学)
概要: 発表者は、これまでの自然言語処理研究の中で、語彙・意味・固有表現等に関する言語情報のアノテーション付きコーパスを構築してきた。人手でコーパスを設計・構築する主な意義は、一定の信頼性を伴った、個別タスクでのモデルの性能評価の手段としての点にある。コーパスアノテーションは、同時に、注目すべき言語現象の全体像を、取捨選択しながら体系化する過程とも言える。本発表では、ウェブテキストの逸脱表現(「崩れた」表現)に対し、語彙的カテゴリ等のアノテーションを行った研究を中心に、発表者らの研究を紹介する。同研究は、最近のモデルに逸脱表現の明示的な処理がどの程度できるのか評価可能にすることを目的としつつ、ウェブテキストで頻繁に生じる言語現象を整理したものである。
略歴: 2014年神戸大学大学院システム情報学研究科博士課程前期課程修了。2022年奈良先端科学技術大学院大学先端科学技術研究科博士後期課程修了。博士(工学)。2014年日本電気株式会社入社。2019年より国立研究開発法人情報通信研究機構に所属し、現在、同機構研究員。2022年より奈良先端科学技術大学院大学客員助教。言語解析、情報抽出を中心とする自然言語処理の研究に従事。
「ロボットから人の知能の謎を解き明かす」
村田 真悟 氏(慶應義塾大学)
概要: これまでに,(1)人間の認知機能を実現する計算メカニズムの構成論的理解,(2)その理解に基づく他者との協調が可能な知能ロボットの実現を目指した研究を行ってきた.また,(3)自閉スペクトラム症や統合失調症等の精神障害をもたらす計算メカニズムの理解を目指した研究も行なってきた.本発表ではこれらの研究について説明し,さらに,現在JSTさきがけで取り組んでいる「脳の計算原理とプレイデータに基づく実世界ロボット学習」の研究についても説明する.
略歴: 2011年早稲田大学創造理工学部総合機械工学科卒業.2013年,2016年にそれぞれ早稲田大学大学院創造理工学研究科総合機械工学専攻修士課程,博士後期課程修了.博士(工学).2016年早稲田大学創造理工学部助手,2018年国立情報学研究所助教・総合研究大学院大学助教(併任)を経て,2020年より慶應義塾大学理工学部専任講師.認知ロボティクス・ロボット学習・計算論的精神医学の研究に従事.
「日英機械翻訳を世界に浸透させるために行った3つのこと」
森下 睦 氏(NTTコミュニケーション科学基礎研究所)
概要: 歴史的な経緯から、機械翻訳研究業界ではフランス語-英語、ドイツ語-英語などの一部の言語対が標準的なベンチマークとされてきた。 研究論文の多くはこれらの有名言語対を対象に実験をしており、私も日々ドイツ語翻訳を中心に実験を行っていた。 しかし、本当は日本語話者として日英翻訳に取り組みたかった。なぜ論文を通すためだけに一単語も読めないドイツ語翻訳の精度を上げているんだろうと常々感じていた。 どうにかして日英翻訳を世界的な標準言語対の一つとし、世界中の多くの人が日英翻訳に取り組むようになり、我々が日英翻訳で論文を書いても全く不思議に思われない環境を整えたかった。 本発表では、私が情熱を注ぐ日英翻訳を世界に浸透させるために行った3つのことを解説する。
略歴: NTT コミュニケーション科学基礎研究所 研究員. 2017年奈良先端科学技術大学院大学情報科学研究科博士前期課程修了. 同年より現職.2022年東北大学大学院情報科学研究科博士後期課程修了.博士(情報科学). 主に機械翻訳、言語資源構築に関する研究に従事.