NLP若手の会 (YANS) 第17回シンポジウム ハッカソン

■更新履歴

  • 2022/08/09: ハッカソン参加者向けアナウンス,およびハッカソンの内容の説明を追加しました
  • 2022/06/30: ハッカソン参加募集ページを公開しました

■重要日程

  • コンペ用データ募集期間:2022/07/01(木) 00:00 〜 2022/07/21(木) 15:00
  • 参加申し込み期間:2022/07/15(金) 00:00 〜 2022/08/15(月) 15:00
  • ガイダンス(Slackでの投稿に加え,Zoomにて実施):2022/08/16(火) 13:00 ~ 14:00
  • コンペ開催期間:2022/08/16(火) 14:00 〜 2022/08/28(日) 17:00
    • Amazon SageMaker Studio Labのアカウント登録 (リファラルコードの期限あり):2022/08/16(火) 13:00 ~ 2022/08/17(水) 13:00
    • リーダーボードセットの出力結果を少なくとも1回リーダーボードに提出:〜2022/08/21(日) 12:00
    • 最終評価セットの出力結果の提出:〜2022/08/28(日) 12:00
    • 発表スライドとソースコードの提出:〜2022/8/28(日) 17:00
  • 成果報告会:2022/08/30(火)シンポジウム2日目のクロージング
  • ハッカソン参加者懇親会:2022/08/30(火)シンポジウム2日目のクロージング後

■ハッカソン参加者向けアナウンス

参加同意書

シンポジウム申し込み時に「ハッカソンに参加する」と回答していただいた方に向けて,登録されたメールアドレスに参加同意書を送信いたします. ガイダンスまでにご提出ください. ご提出いただいた方から,ガイダンス以降,チームを発表しますので,できるだけ早くご提出いただけると幸いです. 参加同意書を提出いただけない方はハッカソンに参加できませんので,ご承知おきください. 提出方法はメールをご確認ください.

ガイダンスまでに参加同意書のメールが届いていない方は,お手数ですが yans2022committee (at) googlegroups.com までご連絡ください.

ガイダンス

ハッカソンを開催するにあたり,ガイダンスを2022/08/16(火)の13:00から実施します. ハッカソンに参加する方は,ぜひご参加ください. また,今回のハッカソンでは,計算機環境としてAmazon SageMaker Studio Labを利用します. アカウントを即時発行するリファラルコードの説明やチュートリアルの実施もあるので,ぜひご参加ください. Zoomのリンクはメール,およびSlackにて共有します. 後日,録画したものの共有を予定しています.

  • ハッカソンの内容の解説 (15分程度)
  • Amazon SageMaker Studio Labのチュートリアル (15分程度)

■ガイダンス時に使用する説明スライド

■概要

ハッカソンスポンサーとしてアマゾンウェブサービスジャパン合同会社様に協力していただき,ECサイトAmazonのレビューデータを用いた特定の評価指標によるコンペティションを開催します. 1チームあたり4名程度で,優秀なチームには表彰があります.

  • 最終評価セットにてスコアの高かったチームへの表彰
  • システムの実装と発表内容に基づいたハッカソンスポンサーからの表彰
    • アマゾンウェブサービスジャパン合同会社様から「Applied Scientist賞」
      • アプローチの新規性: 既存の手法を拡張、応用することで新規・創造性のある手法で解決しているか
      • 実装の実現性: 現実の問題に適用可能な効率的かつスケールする実装を行えているか
      • 背景知識の豊富さ: 先進的な原理と手法を理解し利用できているか

■タスク

各チームには,Amazon商品レビューの商品ごとの「役に立つ投票数」のランキングタスクに取り組んでもらいます. 有用なレビューの予測に貢献でき,レビューをサイトに表示する際の手がかりになります.

■配布データ

Amazon Customer Review Datasetを利用します.提供データは以下のようになっています.(データ数などはスライドに記載)

  • 学習セット:システム開発に利用するための「役に立つ投票数」を含むレビューデータ
  • リーダーボードセット:リーダーボードに途中結果を表示するための「役に立つ投票数」を含まないレビューデータ
  • 最終評価セット:最終順位を決定するための「役に立つ投票数」を含まないレビューデータ

データの入手方法

  • 学習セットとリーダーボードセット:8/16 (火) のガイダンス時に,入手方法をご連絡します.
  • 最終評価セット:8/26 (金) に配布予定です.入手方法は後日ご連絡します.

■評価方法

評価指標

最終評価セットのk=5のNormalized Discounted Cumulative Gain (NDCG@5) になります.(詳細はスライドに記載)

リーダーボード(https://yans2022hackathon.pythonanywhere.com/

リアルタイムにモデルのスコアを測定できるリーダーボードを用意しています.リーダーボードセットにおけるシステムの出力結果を提出し,運営委員がスコア計算用スクリプトで評価します.なお,参加者が最後に提出した出力結果のスコアが掲載されます.リーダーボードに掲載されるスコアおよび順位は,あくまでも最終順位の目安です.

最終評価

最終評価セットの全てに対するシステム出力を提出してください.提出された出力結果の中から,委員側で最終評価データを選定し,スコア計算用スクリプトによって評価し,最終的な順位とします.

ベースラインシステム

■シンポジウムでの成果発表

開発されたシステムの概要や手法の特徴、評価結果の分析等を,シンポジウムにて発表(1チーム3分程度)していただきます. 成果発表会はシンポジウム2日目のクロージングにて開催を予定しています.

■提出方法

出力結果の提出フォーマット

出力結果のフォーマットは,ベースラインシステムのREADME.md (https://github.com/Kosuke-Yamada/yans2022-hackathon-baseline) にしたがってください. ファイル形式は1行ごとのJSONファイルである.jsonlとしてください. ファイル名に関して,リーダーボードセットではsubmit_leader_board.jsonlとしリーダーボードへ提出してください. また,最終評価セットではsubmit_final_result.jsonlを含むチーム名のわかるzipファイル (たとえば,team_z.zip) として提出してください.

スライドとソースコード

  • スライドはpdf形式,ソースコードは使用したコードをまとめたzipファイルを提出してください.それぞれチーム名がわかるようにしてください.

提出先

  • リーダーボード評価:ハッカソン開始時にアナウンスします

  • 最終評価:後日アナウンスします

  • スライドとソースコード:後日アナウンスします

■ハッカソンの手順まとめ

ハッカソンの手順は以下の通りです.

  1. 配布データをダウンロード
  2. 学習セットを利用して,ランキングシステムを開発
  3. リーダーボードに,リーダーボードセットの全ての商品に対する出力結果を提出してスコアを確認
  4. 最終評価セットの全ての商品に対する出力結果を提出
  5. システムのソースコードと,開発したシステムの概要や評価結果の分析結果をスライドにまとめて提出
  6. シンポジウムにて作成したスライドを基に発表

■計算機環境

  • Amazon SageMaker Studio Lab
    • リファラルコードの発行およびチュートリアルを実施
    • 原則,この環境で動く範囲のシステムを開発してください
  • Google colab pro+
    • Google colab pro+の請求書をYANSのメールアドレス (yans2022committee (at) googlegroups.com) に送っていただいた方は,2022年8月分を全額補助 (5,243円/月,2022/8/15現在)
      • 請求書添付用メールのテンプレートはslackをご確認ください

■ルール

  • 参加希望者を運営側で,1チームあたり4名程度で振り分けます
    • アンケートに回答いただき,参加者の経験をもとにチームの振り分けます
  • 一般に無償公開されているデータのみ使用してください
    • 他チームが再現できるかを基準に判断してください
    • 独自に作成したデータであっても,無償公開すれば利用可能です
  • 人力での解答は禁止とします
  • Amazonレビューデータセットは利用しないでください
  • チーム内のコミュニケーションツールとしてYANS2022のslackを提供します
    • それ以外のツールの使用については各チームに任せます

参加者募集

■概要

特定の評価メトリックを用いたコンペ形式の競争になります.
コンペテーマ及びデータにつきましては,外部組織から募集いたします.
データ提供に協力いただいた組織につきましては,ハッカソンスポンサーとしてHPに記載させていただきます.
加えて,YANS第17回シンポジウム(2022)の3名の無料参加枠,及びシンポジウムの2日目(8/30火)に「企業の宣伝」と「テーマ説明」をする時間として5分の発表枠を提供いたします.

■コンペテーマ応募方法

コンペテーマの募集期間は終了しました
募集の締め切りは2022/07/21(木) 15:00です.

ご不明な点があれば,お気軽に yans2022committee (at) googlegroups.com までご連絡ください.

■参加者募集

ハッカソンの参加申し込み期間は終了しました

NLP若手の会 (YANS) 第17回シンポジウム スポンサー募集のお知らせ

NLP若手の会 (YANS) では、自然言語処理および関連分野の若手研究者・若手技術者の交流を促進し、若手のアクティビティを高めることを目的とし、年に一度YANSシンポジウムを開催しております。2020年には334名、2021年には221名の参加をいただいており、若手研究者、特に学生の交流の場として大変盛況となっております。参加者の交流を促進するため、交流企画を積極的に行っているのが特徴です。

YANSシンポジウムでは学生の参加を推奨しており、同分野で頑張る仲間とのつながり、また将来のキャリア形成の参考となる若手研究者・技術者や企業様との交流を持てるよう、できるだけ参加にかかる費用を抑えるようにしております。このような事情ですので、YANSシンポジウムのスポンサー・後援を通してご支援をいただければ大変ありがたく存じます。

第17回シンポジウム (2022年) のスポンサー企業・後援団体にお申し込みいただけるご担当者様は、募集要項をお読みいただき、以下の期間内に yans2022committee+sponsorship@googlegroups.com まで必要事項を明記のうえご連絡ください。

お申込みは先着順とさせていただきます。支援企業・団体様と参加者の交流機会を担保するため、お申し込み多数の場合には、締め切り日を繰り上げさせていただくこともございます。 できましたらお早めのお申し込みをお願い申し上げます。

過去のシンポジウムにご支援いただいた企業・団体様は以下のリンクよりご参照いただけます。また過去のシンポジウムの開催報告も掲載しておりますので、よろしければご参照ください。

第14回シンポジウム(2019年)スポンサー企業・後援団体様

第13回シンポジウム(2018年)スポンサー企業・後援団体様

第12回シンポジウム(2017年)スポンサー企業・後援団体様

以上、よろしくご検討下さいますよう、お願い申し上げます。

NLP若手の会 2022年委員長

萩行 正嗣
梶原 智之

受付期間

2022年7月7日(木)〜2022年8月5日(金)

※ 受付は終了しました

募集要項

ご応募いただく企業・団体様は、自然言語処理技術を製品開発にご活用されている、もしくは自然言語処理研究に取り組まれていることを原則といたします。 ご支援いただきました資金は、主に参加者交流促進のためのイベント企画運営および参加者の経済的負担を軽減する目的で利用いたします。

申し込み必要事項

  • 企業名・団体名

  • 種別(スポンサー/後援): 「スポンサー」と「後援」のどちらかをお選びください(名称のみの違いとなります)。加えて、ご希望のコースを「プラチナ」「ゴールド」「シルバー」よりお選びください。

  • ご担当者様の氏名・部署名・メールアドレス・電話番号

  • 掲載名称(企業名・団体名):Webページに掲載します。

  • 掲載名称(企業名・団体名)のフリガナ

  • ロゴ画像:事務局にてWebページへ掲載いたします。横450 px ・縦200 px 以上のなるべく大きなサイズの画像 (PING, JPEG, GIF形式が可能です) をご用意願います。

  • URL (1つのみ) :ロゴ画像からリンクいたします。

  • スポンサーブースの有無:「スポンサーブース」の利用の有無をお知らせください。

  • 電子パンフレット配布の有無:「電子パンフレット配布」の利用の有無をお知らせください。

  • ノベルティの配送代行の有無:「ノベルティの配送代行」の利用の有無をお知らせください。

  • スポンサー賞 / 口頭発表 の選択:「ゴールド」をご選択の場合は、口頭発表、スポンサー賞の授与のどちらを希望されるかお知らせください。

申し込みフォーマット

  • 企業名・団体名:
  • 種別(スポンサー/後援):
  • 担当者
    • 氏名:
    • 部署名:
    • メールアドレス:
    • 電話番号:
  • 掲載名称(企業・団体名):
  • 掲載名称(企業・団体名)のフリガナ:
  • ロゴ画像: (添付ファイルにてお送り下さい)
  • URL:
  • スポンサーブース:有り・無し
  • 電子パンフレット配布:有り・無し
  • ノベルティの配送代行:有り・無し
  • スポンサー賞 / 口頭発表 :(ゴールドの場合、ご記載下さい)

支援種目

スポンサー・後援 料金 ロゴ ブース 招待枠 電子パンフレット配布 ノベルティの配送代行 口頭発表 スポンサー賞
プラチナ 30万円 特大 3名
ゴールド 20万円 3名 いずれか1つを選択
シルバー 10万円 3名

※ハッカソンスポンサーをご希望の企業・団体様は こちらのページ よりお申し込みください。

特典

1)ロゴ

NLP若手の会のWebページに、御社のロゴを掲載いたします。ロゴの大きさはスポンサーの種類により異なります。同一種類のスポンサー内での掲載順序は基本的に申し込み順とさせて頂きます。Webページからは、ご希望のリンク先1ヶ所に対するリンクを張ることができます。

2)スポンサーブース

Gather.townでスポンサーブースをご利用いただけます。今年はスポンサーブースのより一層の活性化のためにスタンプラリー企画を実施致します。

3)招待枠

3名分の参加費を無料とさせていただきます。

4)電子パンフレット配布

スポンサー様のパンフレット等の電子データをシンポジウムの参加者の皆様へ一括配布致します。

5)ノベルティの配送代行

スポンサー様よりシンポジウム参加者へご提供したいノベルティの配送代行を承ります。

6)口頭発表

スポンサー企業・後援団体様で取り組まれておられる自然言語処理や機械学習関連技術の活用に関する話題を中心にお話しいただけます。新卒・中途社員募集やアルバイト・インターン募集に関する告知を行っていただくことも可能です。発表時間は5分です。

7)スポンサー賞

ポスター発表を行った学生に対し、スポンサー賞を授与していただけます。受賞者は、スポンサー様それぞれで1名ずつ決定していただきます。副賞をスポンサー様よりご用意いただだき、授与していただくことも可能です。スポンサー賞授与式は、シンポジウム最終日のクロージングでの実施を予定しております。スポンサー賞の詳細については、授与を希望されるスポンサー様に別途ご連絡させていただきます。

口頭発表、ブース、ノベルティ、パンフレットなどの特典の詳細については、スポンサー・後援のお申込み後にご連絡させていただきます。また口頭発表のタイトルや概要の締め切りは別途設定させていただきます。

ご質問等ございましたら、yans2022committee+sponsorship@googlegroups.com までご連絡ください。

NLP若手の会 (YANS) 第17回シンポジウム スポンサー一覧

NLP若手の会 (YANS) 第17回シンポジウムは以下のスポンサーの皆様に協賛いただいております。

プラチナスポンサー

株式会社サイバーエージェント
株式会社サイバーエージェント
株式会社PKSHA Technology
株式会社PKSHA Technology

シルバースポンサー

ファーストアカウンティング株式会社
ファーストアカウンティング株式会社

ハッカソンスポンサー

Powered by AWS Cloud Computing
アマゾン ウェブ サービス ジャパン合同会社

NLP若手の会 (YANS) 第17回シンポジウム (2022)

NLP 若手の会

NLP 若手の会は,自然言語処理,計算言語学および関連分野の,若手研究者および技術者の学問研究および技術開発の促進をはかり,参加者の相互交流および成長の場を提供し,培われた学問研究および技術開発の成果が実社会に応用されることを奨励し,この分野の学問および産業の進歩発展に貢献することを目的として,年に1度,研究シンポジウムを開催しています.

本シンポジウムを通して密な議論を行う機会を設けるとともに,組織や研究室,業種を横断する幅広いつながりを醸成する機会を設けます.2020年には334名,2021年には221名の参加があり,多数の学生・若手研究者との交流が期待できます.

昨年に引き続き,今年も新型コロナウイルス感染症に関する状況を鑑み,オンラインで開催いたします.

更新情報

  • 参加申し込みを終了しました (2022/08/26) new!
  • プログラムを公開しました (2022/08/15)
  • ハッカソンのページにハッカソン内容の説明を追加しました (2022/08/09)
  • 発表申し込みを終了しました (2022/08/05)
  • 発表・事前参加申し込みを開始しました (2022/07/15)
  • スポンサーの募集を開始しました(2022/07/07)
  • ハッカソンのページを公開しました (2022/06/30)
  • シンポジウムのスケジュールを掲載しました(2022/06/20)
  • シンポジウムの開催概要を掲載しました (2022/05/09)

開催日

2022年8月29日(月),30日(火)
※懇親会は8月28日(日)に開催予定です.

開催地

オンライン開催

参加費

参加費(税込み)は以下の通りです.

学生 社会人
通常
【発表参加】2022年7月15日(金)12:00 - 2022年8月5日(金)15:00 ※
【聴講参加】2022年7月15日(金)12:00 - 2022年8月19日(金)15:00
500円 2,000円
直前
2022年8月19日(金)15:00 - 2022年8月26日(金)15:00
3,000円 5,000円

※ プログラム編成作業の都合上,聴講参加の場合よりも早い締切となっていますのでご注意ください.

プログラム

概要

  • 一般発表(ポスター)
  • チュートリアル
    • 桂井 麻里衣 氏(同志社大学理工学部):「学術情報検索と推薦」
    • 東中 竜一郎 氏(名古屋大学大学院情報学研究科): 「対話システムのすすめ」
  • 招待セッション
    • 江里口 瑛子 氏(Microsoft): 「多言語機械翻訳モデルにおける、X-Y方向の翻訳性能改善」
    • 磯 颯 氏(Megagon Labs):「Opinion Summarization from Customer Reviews」
    • 渡邉 研斗 氏(産業技術総合研究所):「歌詞情報処理という新分野を立ち上げるまで 〜 我儘(?)に研究してきた一人の研究者の例」
    • 上垣外 英剛 氏(奈良先端科学技術大学院大学 情報科学領域):「自然言語処理における負例サンプリング損失の進展」
  • ハッカソン
  • 懇親会

シンポジウムの各プログラムにはGather.townとZoomを使用します.

プログラム詳細

NLP若手の会 (YANS) 第17回シンポジウム プログラム - NLP 若手の会

発表に対する賞

本シンポジウムでは,優秀な研究発表に奨励賞を授与いたします. 本奨励賞はこれから始まる,または始まったばかりの研究を奨励することを主旨とするものであり,現時点の研究の完成度よりもアイディアの面白さ,及び,新規性や発展性への期待を重視します.また,産学交流の一環として,スポンサーの企業・団体様独自の視点から賞を授与する「スポンサー賞」が用意されています. 様々な観点から受賞するチャンスがあります.たくさんの発表申し込みをお待ちしております.

発表募集要項

これから始まる,または始まったばかりの研究の発表を歓迎します.本シンポジウムでの活発な議論を通じて,研究の進展を促進することを目指します.

発表テーマ

  • 自然言語処理・計算言語学
  • テキストマイニング
  • 音声言語処理
  • 人工知能
  • その他関連分野

発表資格

参加者の相互交流および成長の場を提供するという趣旨に照らし,特に学生および博士号取得後8年以内の参加者の発表を推奨いたします.自然言語処理および関係分野の研究を始めたばかりの方の発表や,始まったばかりの研究(未完成の研究)に関する発表を奨めます.発表申込に際し,特定の学会に所属している必要はございません.

発表形式

本シンポジウムでは,ポスター発表を募集いたします.ツールはGather.townを使用します. ポスターは横置きのJPGかPNGファイルとして作成してください. 詳細は以下の通りです.

  • 形式: PNG / JPG
  • サイズ: 横置き、3MB まで
  • 幅は最低1000px、高さは最低600px
  • 解像度: 72dpi以上推奨

発表資料の提出締切は「2022年8月22日(月)18:00」を予定しております.

発表申込方法

「事前参加登録」の欄の「事前参加登録システム」より,申し込みをお願いいたします.なお,原則全てのお申し込みを受け付けますが,以下の点などにより,ご発表をご遠慮いただく場合があります.この場合,個別にご案内いたします.

  • 本シンポジウムの開催趣旨から大きく逸脱する発表はご遠慮いただく場合があります.
  • 申込が多数となった場合は未発表および早期申込の発表を優先する場合があります.

参加募集要項

本シンポジウムでは,聴講のみの参加も受け付けています. 自然言語処理および関係分野に興味を持ち始めたばかりの方の参加を歓迎いたします. なお,原則全てのお申し込みを受け付けますが,申込が多数となった場合は早期申込の方を優先し,参加募集を打ち切る可能性があります.

事前参加登録(参加・発表)

※ 発表申込,参加申込は終了しました

発表申込期間:2022年7月15日(金)12:00 - 2022年8月5日(金)15:00
参加申込期間:2022年7月15日(金)12:00 - 2022年8月26日(金)15:00

NLP若手の会(YANS)第17回シンポジウム 事前参加登録システム

スケジュール

  • 発表申込期間:2022年7月15日(金)12:00 - 2022年8月5日(金)15:00
  • 発表資料の提出締切:2022年8月22日(月)18:00 (発表者のみ)
  • 参加申込期間:2022年7月15日(金)12:00 - 2022年8月26日(金)15:00
  • ハッカソン(コンペ開催期間):2022年8月16日(火) 14:00 - 2022年8月28日(日) 17:00
  • 懇親会:2022年8月28日(日)
  • シンポジウム: 2022年8月29日(月),30日(火)

主催

NLP 若手の会
NLP 若手の会運営委員会

スポンサー

プラチナスポンサー

株式会社サイバーエージェント
株式会社サイバーエージェント
株式会社PKSHA Technology
株式会社PKSHA Technology

シルバースポンサー

ファーストアカウンティング株式会社
ファーストアカウンティング株式会社

ハッカソンスポンサー

Powered by AWS Cloud Computing
アマゾン ウェブ サービス ジャパン合同会社

NLP 若手の会第17回シンポジウム運営委員

委員長
- 萩行 正嗣 (ウェザーニューズ)
- 梶原 智之 (愛媛大)

委員
- 阿部 香央莉 (東北大)
- 大杉 康仁 (NTTレゾナント)
- 高山 隼矢 (ヤフー)
- 中村 優太 (東大)
- 人見 雄太 (Insight Edge)
- 平野 正徳 (東大)
- 三浦 泰嗣 (リクルート)
- 村山 友理 (お茶大)
- 相田 太一 (都立大)
- 岡 佑依 (NTT CS研)
- 平岡 達也 (富士通)
- 村上 聡一朗 (サイバーエージェント/東工大)
- 山田 康輔 (名大)
- 山田 寛章 (東工大)

顧問
- 高瀬 翔 (東工大)

お問い合わせ

NLP 若手の会第17回シンポジウム運営委員会
yans2022committee (at) googlegroups.com

NLP若手の会懇親会 (YANS懇) 2022 をオンライン開催します!

言語処理学会第28回年次大会(NLP2022) に併せて,NLP若手の会(YANS)主催の懇親会をオンラインで開催します.参加者が150名~200名と比較的大きな懇親会となっており,所属を越えて多くの若手研究者との交流,深い議論,新たな発見などが生まれることが期待されます.どうぞご同僚,ご友人お誘いあわせのうえ,奮ってご参加ください.

詳細は,随時こちらのページとTwitter, Facebookで更新していきます.

お知らせ

  • 2022/3/1 参加者の追加募集を開始しました!(追加募集は終了しました)
  • 2022/2/17 参加申し込みを開始しました!(一次募集は終了しました)

日程

2022年3月11日(金)
※言語処理学会年次大会期間中ではなく開催前ですのでご注意ください.

会場

オンライン (Zoom)

参加条件

  • 言語処理業界及び関連分野の発展を願う若手研究者(企業・大学の別は問わず,学生もご参加いただけます)

プログラム

  • 18:30 - 20:00:「NLP若手の悩めるキャリア 2022」
    • 18:30 - 18:35:オープニング
    • 18:35 - 19:00:登壇者自己紹介
    • 19:00 - 19:50:パネルディスカッション
    • 19:50 - 19:55:クロージング
    • 19:55 - 20:00:休憩
  • 20:00 - 22:00:懇親会

パネルディスカッション:「NLP若手の悩めるキャリア 2022」

司会:高瀬 翔(東工大)
登壇者:叶内 晨(Capex),菅原 朔(NII),濱園 侑美(お茶大),石渡 祥之佑(Mantra),中村 優太(東大)

NLP分野の最前線で活躍し,さまざまなバックグラウンドを持つ方々をお招きしてパネルディスカッションを行います. 所属を越えた情報交換の場として,登壇者にはキャリア,金銭面,研究・仕事の進め方,ワークライフバランスなど学生や若手研究者が集まる会ならではのざっくばらんな議論をしていただきます.

懇親会

Zoomのブレイクアウトルーム機能を用いて参加者をランダムに少人数のグループ(4, 5人程度)に振り分けて懇親会を行います.グループの振り分けは複数回行う予定です.

参加申し込み

追加募集は終了しました.

※ 追加募集期間は3/1 (火) 11:00〜3/9 (水) 17:00です.
※ 一次募集期間は2/17 (木) 11:00〜2/27 (日) 17:00です.
※ 参加者数が上限に達した場合募集を打ち切りますので,参加希望者はぜひお早めにお申し込みください.

スケジュール

  • 募集開始:2/17 (木) 11:00
  • 一次締切:2/27 (日) 17:00
  • 追加募集開始:3/1 (火) 11:00
  • 最終締切:3/9 (水) 17:00
  • YANS懇:3/11 (金)

キャンセル方法

キャンセルの場合はお早めにyans2021committee (at) googlegroups.comまでご連絡ください.

ライトニングトーク(LT)の募集

本懇親会に参加される方による2分間ほどのLTを募集しております.年次大会前にご自身の発表や会社の宣伝などにご活用いただければと思います.ご発表をお待ちしております.発表資料をご用意される場合は,Zoomの画面共有機能をお使いいただけます.
なお,発表者は先着15名までとします.定員を超過して発表いただけない場合はこちらからご連絡いたします.ご了承ください.

ご不明な点があれば,お気軽に yans2021committee (at) googlegroups.com までご連絡ください. どうぞよろしくお願いいたします.

NLP若手の会 (YANS) 第16回シンポジウム 開催報告

2021年8月30日(月)、31日(火)、NLP若手の会第16回シンポジウム(YANS2021)を開催しました。

今年も昨年に引き続き、COVID-19の影響でオンライン開催となりましたが、221名(学生137名,社会人84名)の参加登録と、71件の発表(学生61件,社会人10件)があり、盛況でした。 また、今年はチュートリアルも企画し、筑波大学の馬場雪乃氏に「Human-in-the-loop 機械学習」を、NAISTの渡辺太郎氏に「Back to the noisy channel」をご講演いただきました。

ご参加いただいた皆様、どうもありがとうございました。

研究発表に先立ち、ハッカソンも行いました。 今年は、参加者の皆様からデータ提供を募り、特定の評価メトリックを用いたコンペ形式としました。 コンペ期間を2週間に設定し、理研AIPの森羅を用いたWikipediaからの属性値抽出に5チームが取り組みました。 途中結果をリーダーボードで共有し、シンポジウム最終日にハッカソンの最終成果発表を行いました。

スライドなど

オープニング・クロージング

drive.google.com drive.google.com

チュートリアル

馬場 雪乃 氏(筑波大学): 「Human-in-the-loop 機械学習」

speakerdeck.com

渡辺 太郎 氏 (NAIST): 「Back to the noisy channel」

docs.google.com

ハッカソン

ハッカソンについて

yans.anlp.jp

ハッカソン成果報告 表彰

drive.google.com

チーム発表

シンポジウムの様子

昨年に引き続き、今年の様子を画像とグラフでお伝えします。

f:id:YANS:20210903152146p:plain
gatherでシンポジウム会場を設営しました
f:id:YANS:20210903152251p:plain
雑談部屋では、それぞれのエリアで個別で話せるようにしました
f:id:YANS:20210903150801p:plain
ポスターセッションの様子
f:id:YANS:20210903151821p:plain
素敵なビーチも用意しました
f:id:YANS:20210904165020p:plain
今年は学生の参加が多くなりました
f:id:YANS:20210904164749p:plain
申込期間を3つに分けて
価格に変動をつけました
直前での申込が減少しました
f:id:YANS:20210904164807p:plain
発表を行う方の参加申込は
通常申込期間に増えました
f:id:YANS:20210903172631p:plain
今年の参加者数は昨年よりは少ないものの、参加費有料開催では増加傾向です
f:id:YANS:20210903172601p:plain
今年の発表者数は昨年よりも多くなりました

NLP若手の会 (YANS) 第16回シンポジウム ハッカソン

■更新履歴

■概要

特定の評価メトリックを用いたコンペ形式の競争になります. 公開システムは, 森羅 SHINRA – Wikipedia 構造化プロジェクト で活用される予定であり,日本語における知識ベースの構築に貢献することができます.

■タスク

各チームには,Wikipedia記事から各カテゴリに設定された属性の値を抽出するタスクに挑戦してもらいます.例えば,以下のように「シャネル」というタイトルのWikipedia記事の中から,事前に定義された属性(正式名称,設立年,本拠地国など)に対応する値を抽出します.(詳細はスライドを参照) f:id:YANS:20210804173006p:plain

■配布データ

データ概要

理研AIP言語情報技術アクセスチームが提供する森羅2020JP-5(森羅2020-JP: 日本語構造化タスク – 森羅 SHINRA)の中で,「市町区村名」と「企業名」の2カテゴリを対象とします. 学習データを用いて期間中に開発を行っていただき,テストデータを用いて最終的な評価結果を決定します.提供データは以下からなります.

  • ターゲットデータ:属性値の抽出対象ページ(JP-5内の全ページ)
    • 学習データ:モデルの学習と開発に使用してください(正解は公開です)
    • 最終評価用データ:最終的な順位づけを行うためのテストデータです(対象データと正解は非公開です)
  • リーダーボード用評価データ:リーダーボード上での評価を行うためのテストデータです

データの入手方法

[ターゲットデータ] ハッカソン開始時にSlackにてご連絡します

[リーダーボード用評価データ] ハッカソン開始時にSlackにてご連絡します

■評価方法

評価指標

最終評価データの2カテゴリにおけるFスコアの平均値とします. GitHub - k141303/shinra_jp_scorer: 森羅2020タスク用のスコアラーを用いてシステムを評価できます.

リーダーボード(https://yans2021hackathon.pythonanywhere.com/

リアルタイムにモデルのスコアを測定できるリーダーボードを用意しています.リーダーボード用の評価データを参加者に期間中のみ公開します.システムの出力結果を提出し,運営委員がスコア計算用スクリプトで評価します.なお,参加者が最後に提出した出力結果のスコアが掲載されます.リーダーボードに掲載されるスコアおよび順位は,あくまでも最終順位の目安です.

最終評価

ターゲットデータデータ全てに対するシステム出力を提出してください.提出された出力結果の中から,委員側で最終評価データを選定し,スコア計算用スクリプトによって評価し,最終的な順位とします.

ベースラインシステム

■シンポジウムでの成果発表

開発されたシステムの概要や手法の特徴、評価結果の分析等を,シンポジウムにて発表(1チーム3分程度)していただきます.

■提出方法

フォーマット

出力結果のフォーマットは,森羅2020-JP: データフォーマット – 森羅 SHINRAにしたがってください.学習データと森羅2019のシステム出力と同じ形式になります.2カテゴリ分のJSONファイル一式を一つのディレクトリに格納し、zipファイルとして提出してください.実行結果のファイル名はCity.jsonとCompany.jsonとして下さい.参加グループ名が分かるフォルダをzip形式で圧縮したものをご提出ください.

提出先

リーダーボード評価:YANS2021 ハッカソン - リーダーボード

最終評価:後日アナウンスします

■ハッカソンの手順まとめ

ハッカソンの手順は以下の通りです.

  1. 配布データをダウンロードしてください
  2. 学習データを使って属性値抽出システムを開発してください
  3. リーダボードを使用する場合は,リーダーボード用評価データ全てに対する出力結果を提出し,スコアを確認してください
  4. ターゲットデータ全てに対するシステム出力を、8/30(月)15時までに所定フォーマットにしたがって提出してください
  5. 最終評価データ部分の評価結果を返却します
  6. 開発されたシステムの概要や手法の特徴、評価結果の分析等を,シンポジウムにて発表(1チーム3分程度)して下さい

■ルール

  • 利用可能なデータは、一般に無償公開されているデータのみとします
    • 他チームが再現可能かを基準にして判断してください
    • 独自に作成したデータであっても,無償公開すれば利用可能です
  • 人手でのテストデータに対する解答を禁止します
  • 計算リソースは参加者側で用意してください
  • チーム内のコミュニケーションツールとしてYANS2021のslackを提供します
    • それ以外のツールの使用については各チームに任せます

■重要日程

  • 参加申し込み期間2021/07/01(木) 00:00 〜 2021/07/21(水) 15:00
  • コンペ用データ募集期間2021/07/01(木) 00:00 〜 2021/07/21(水) 15:00
  • ガイダンス(Slackにて投稿)2021/08/16(月) 00:00
  • コンペ開催期間:2021/08/16(月) 18:00 〜 2021/08/29(日) 21:00
  • ターゲットデータ全てに対するシステム出力結果の提出:2021/8/27(金)9:00〜2021/8/30(月)15:00
  • 発表スライドの提出:〜2021/8/30(月)21:00
  • 成果報告会:2021/08/31(火)シンポジウム2日目

参加者募集(参加者・データ提供ともに募集は終了しました)

ハッカソン内容

特定の評価メトリックを用いたコンペ形式の競争になります。 コンペで使用するデータセットについては,参加フォームより募集を行います。 このため、コンペのデータとタスクについては後日告知させて頂きます。(公開時期は8/13(金)を予定しております) 以下ハッカソン詳細について目を通した上で,参加申し込みをお願いいたします。 ※成果物や提供されたデータに関する著作権等を守るため、ハッカソン開催前に参加者全員に同意書の提出をお願いする予定です.

参加形式

3人1組のチーム制です. ハッカソン参加希望者に後ほど配布するアンケートにて,「NLP経験年数」,「Kaggle等コンペ経験年数」,「プログラミング経験年数」などをお聞きし,チームのスキルレベルが偏らないように運営側でチームの編成を行います. またチーム内の所属が被らないように調整も行います. 場合により,一部4人チームを編成します. チーム編成の発表は8/13(金)を予定しております.

参加条件

計算資源は運営側で用意できないため,計算資源を用意できる方のみの参加とさせていただきます. 学生,社会人問わず奮ってご参加ください. シンポジウム2日目の8/31(火)にチームでの取り組みを1チーム3分程度で発表頂く予定です.

データ募集

本コンペで使用するデータを募集します. データの著作権,知財等は当該素材の提供元である企業に帰属する旨を,参加同意書にて参加者に提出していただきます. なお,データ提供希望者と運営委員で複数回の打ち合わせを予定しておりますので,ご了承の上,データ提供希望を申請してください.