言語選択

言語の選択:

オンライン状況

オンラインユーザー 3人
ログインユーザー 0人

カウンター

あなたは59179人目です。

YANSサイトへようこそ

NLP若手の会(YANS)へようこそ

NLP若手の会 (YANS) は、自然言語処理および関連分野の若手研究者の交流を促進し、若手のアクティビティを高めることを目指したコミュニティです。

なおYANSは、Young Researcher Association for NLP Studiesの頭文字をとったものです。


日誌

■YANSからのお知らせ
 12|
作成日2010/09/01タイトル第14回 東大・東工大合同勉強会(T2 meeting)by: hashimoto|勉強会
第14回 東大・東工大合同勉強会(T2 meeting)

今回のT2 meetingは「NLPの応用」というテーマで発表を行います.
NLPの若手研究者だけでなく,これらの分野に興味がある方の参加を
歓迎します.

日時:2010/9/17(金) 16:00 - 18:00
場所:国立情報学研究所12階会議室
交通アクセス情報:http://www.nii.ac.jp/access/

発表者:木村 泰知(小樽商科大学)
題目:「地方政治を対象とした自然言語処理技術の利用」

発表者:橋本 泰一(東京工業大学)
題目:「自然言語処理と不自然言語処理」



作成日2010/08/16タイトル第13回 東大・東工大合同勉強会(T2 meeting)by: hashimoto
今回のT2 meetingは「NLPと言語学」というテーマで,通常のNLPの
研究者による発表だけでなく,言語学の研究者による発表を予定し
ています.また,言語を扱うという近い関係にあるこれら2つの分野
において互いにどのような貢献が可能なのか,といったようなこ
とから,そもそもNLP,言語学って何?ということまで幅広い議論を
行うセッションを計画しています.
NLPの若手研究者だけでなく,言語学の若手研究者,また,これらの
分野に興味がある方の参加を歓迎します.

日時:2010/8/19(木) 16:00 - 20:00
場所:東京工業大学 大岡山キャンパス 西8号館E 6F コラボ室

発表者:荒牧 英治(東京大学 知の構造化センター)
題目:「偏りなく誤る言語処理: 適合度による言語処理技術の検定」

発表者:今田 水穂(筑波大学)
題目:「ウナギ文の情報構造」
作成日2010/06/14タイトル第11回 東大・東工大合同勉強会(T2 meeting)by: hashimoto|勉強会
第11回 東大・東工大合同勉強会(T2 meeting)

日時:2010/6/17(木) 18:00 - 20:00
場所:NII 2005講義室1
 
発表者:難波 英嗣 (広島市立大学)
題目: 論文と特許を対象にした技術動向分析 - 第7回、第8回NTCIRワークショップ 特許マイニングタスク -

発表者:松島 慎 (東大 中川研)
題目:Suppotclass Passive Aggressive アルゴリズム(SPAアルゴリズム)

作成日2010/06/07タイトルマイクロソフト・リサーチトーク@東大URLby: aramaki|講演会
#重複して受け取られた方にはご容赦ください.
マイクロソフト・リサーチの研究者のトークがあります
興味を持たれた方はご参加ください

【場所】6月21日 16:00-18:00
- Hide quoted text -
【日時】東京大学 理学部7号館214教室 (辻井研)
# 夜には会食も予定しております

【話者】Ms. Ruihua Song
【題目】Identification of ambiguous queries in web search
【概要】It is widely believed that many queries submitted to search engines
are inherently ambiguous(e.g., java and apple). However, few studies
have tried to classify queries based on ambiguity and to answer "what
the proportion of ambiguous queries is." Our work deals with these
issues. First, we clarify the definition of ambiguous queries by
constructing the taxonomy of queries from being ambiguous to
specific. Second, we ask human annotators to manually classify
queries. From manually labeled results, we observe that query
ambiguity is to some extent predictable. Third, we propose a
supervised learning approach to automatically identify ambiguous
queries. Experimental results show that we can correctly identify 87%
of labeled queries with the approach. Finally, by using our approach,
we estimate that about 16% of queries in a real search log are
ambiguous.

Bio: Ms. Ruihua Song received B.E. and M.E. degrees from Tsinghua
University in 2000 and 2003. Then she joined Microsoft Research Asia
and now works as a researcher in Web Data Management group. Her main
research interests are Web information retrieval and Web information
extraction. She serves SIGIR, SIGKDD, CIKM, ECIR, etc. as PC members
and NTCIR as a coordinator. Her homepage is
http://research.microsoft.com/users/rsong/.


【話者】Tetsuya Sakai
【題目】Different Intents, Different Views - New Evaluation Methods
【概要】This talk consists of two parts.  First, I will describe a new
method for evaluating diversified Web search results that are output
in response to ambiguous or underspecified queries.  I will show some
experimenal results with the TREC 2009 Web track data and demostrate
the advantages of my approach over existing methods.  Second, I will
describe a new method for evaluating the task of finding good answers
from community question answering (CQA) data.  Handling user-generated
contents such as CQA data is particularly challenging because they
vary widely in quality and reflect different people's subjective
views.  I will show some latest results from the NTCIR-8 CQA task to
demonstrate the advantages of my approach.

Bio: Tetsuya Sakai received a Master's degree from Waseda University
in 1993 and joined the Toshiba Corporate R&D Center in the same
year. He received a Ph.D from Waseda University in 2000 for his work
on information retrieval and filtering systems.  From 2000 to 2001, he
was a visiting researcher at the University of Cambridge Computer
Laboratory. In 2007, he became the Director of the Natural Language
Processing Laboratory at NewsWatch, Inc. In 2009, he joined Microsoft
Research Asia. He is the ACM SIGIR Regional Representative to the
Executive Committee (Asia/Pacific) and Chair of IPSJ SIG-IFAT.  He has
served as a Senior PC member for ACM SIGIR and for CIKM. He is on the
editorial board of Informaiton Processing and Management and that of
Information Retrieval the Journal.  He has received several awards in
Japan, mostly from IPSJ.

作成日2010/05/26タイトル第10回 東大・東工大合同勉強会(T2 meeting)by: hashimoto|勉強会
第10回 東大・東工大合同勉強会(T2 meeting)

日時:2010/5/27(木) 18:00 - 19:30
場所:東京工業大学 大岡山キャンパス 西8号館6F会議室

発表者:岡崎 直観 (東工大 辻井研)
題目:類似文字列検索

概要:
Webページなどの実際のテキストに対して,辞書やシソーラスなどの言語資源を
活用する際,実テキストと言語資源で表層表現が一致せず,歯がゆい思いをする
ことがある.本発表では,言語資源とテキストを柔軟にマッチングさせる技術と
して,類似文字列検索を紹介する.本発表では,類似文字列検索の最近の研究動
向と,自然言語処理への応用事例をいくつか紹介する.
作成日2010/03/01タイトル第三回 奈良先端大・NICT合同勉強会 (N2ミーティ
ング)
by: kawahara|勉強会
第三回 奈良先端大・NICT合同勉強会 (N2ミーティング)

日時: 2010/3/5(金) 16:00-18:00
場所: 奈良先端科学技術大学院大学 情報科学研究科棟 松本研究室 (A706)

発表者: 水野淳太 (奈良先端科学技術大学 情報科学研究科 自然言語処理学講座)
題目: 含意関係認識のための構造的アライメント
概要: 含意関係認識は,1対のテキストが与えられたときに,一方のテキストを
他方のテキストが内容的に含意するかどうかを,1)含意,2)矛盾,3)不明の3値
に分類するタスクとして研究が進められており,多文書要約や質問応答などに
おいて重要な技術である.近年では,テキスト間で意味的に対応する単語間に
アライメントを行い,その結果をもとに関係分類(3値分類)を行う手法がよく研
究されている.先行研究では類似単語間に対応付けを行った上で,それらが同
一の実体であるかといった意味的な対応付けは共参照解析として行い,それら
を素性として関係分類を行っている.しかしながら,共参照解析や述語項構造
解析といった解析は精度が十分ではない.また,それらの情報は関係分類の段
階で素性として用いられており,関係分類を複雑な行程にしている.そこで,
本研究では,まず文節単位で類似度に基づくアライメントを行い,次に述語項
構造や係り受け構造といった文構造の類似度に基づいた構造的アライメントを
行う手法を提案する.例えば,「キシリトールは_虫歯予防に_効果的だ」と
「キシリトールは_虫歯を_防ぐ」という2文において,その係り受け構造から,
「キシリトールは_効果的だ」と「キシリトールは_防ぐ」,「虫歯予防に_
効果的だ」と「虫歯を_防ぐ」の2つの構造的アライメントをとることができる.
本発表では,含意関係認識における構造的アライメントの意味付けやその手法
について議論し,報告する.

発表者: 土田正明 (NICT 知識創成コミュニケーション研究センター MASTARプロジェクト 言語基盤グループ)
題目: 意味的関係獲得への類推アプローチ
概要: 単語間の意味的関係獲得法として,類推に基づくアプローチを試みてい
る.類推とは「似ている点から,他のことを推し量ること」で,本研究では
「似ている」を「単語間の分布類似度」と捉える.本研究では,類推のアプロー
チによって,関係獲得の主流であるパタンベース法(2語を結ぶ構文的パタン
を主な手がかりとする)と対比をなす,ノンパタンベース法の可能性を示す.
提案法は,パタンベース法では困難な文中で共起しない2語の関係をも獲得でき
る利点がある.さらに,未検証ではあるが,現在知られていない単語間の関係
が仮説として生成される可能性もあることから,知識の「獲得」ではなく「生
成」としての可能性も秘めている.本発表では,具体的な方法と実験結果を紹
介する.

会場に関する連絡先: 村上浩司 (kmurakami -at- is.naist.jp)
作成日2009/12/13タイトル第9回 東大・東工大合同勉強会(T2 meeting)URLby: hashimoto
第9回 東大・東工大合同勉強会(T2 meeting)

日時:2009/12/17(木) 18:00 - 19:30
場所:東京大学 本郷キャンパス 理学部7号館 202号室
     http://www.u-tokyo.ac.jp/campusmap/cam01_06_06_j.html


発表者:松崎 拓也(東大 辻井研)
題目:HPSG supertagging

概要:
Supertagging と呼ばれる構文解析技法に関し,最近の研究結果と現在の
課題について紹介する.

HPSG, LTAG, CCGなど語彙化文法を用いた構文解析は,入力文の各単語に
語彙項目(supertag)を割り当てる段階と,文法規則によってそれらの語彙
項目を組合せ,構文木を組み立てる段階の2つに分けて考えることができ
る.

ひとつの語彙項目は,ある単語がとりうる統語構造のうちのひとつを表し,
入力文中のある単語に語彙項目を割り当てることは,その文におけるその
単語の統語的ふるまいを詳細に指定することになる.

Supertagging とは,語彙項目割り当てに統計モデルを適用し,精度よく
これを行うことで,構文解析全体の高速化と高精度化をねらう手法である.

発表では,大規模HPSG文法を用いた Supertagging の実行例をまじえ,こ
のタスクの面白さが伝わればと思います.
作成日2009/12/03タイトル第二回 奈良先端大・NICT・NTT合同勉強会 (N3ミー
ティング)メール
by: hashimoto|勉強会
第二回 奈良先端大・NICT・NTT合同勉強会 (N3ミーティング)

日時: 2009/12/11(金) 16:00-18:00
場所: 奈良先端科学技術大学院大学 情報科学研究科棟 松本研究室 (A707)

発表者: Varga IstvAan (独立行政法人 情報通信研究機構 知識創成コミュニケーション研究センター 言語基盤グループ)
題目: Bilingual dictionary generation for low-resourced language pairs: a simple attempt
概要: Bilingual dictionaries are vital resources in many areas of
natural language processing. Numerous methods of machine translation
require bilingual dictionaries with large coverage, but less-frequent
language pairs rarely have any digitalized resources.  Since the need
for these resources is increasing, but the human resources are scarce
for less represented languages, efficient automatized methods are
needed. This paper introduces a fully automated, robust pivot language
based bilingual dictionary generation method that uses the WordNet of
the pivot language to build a new bilingual dictionary. We propose the
usage of WordNet in order to increase accuracy; we also introduce a
bidirectional selection method with a flexible threshold to maximize
recall. Our evaluations showed 79% accuracy and 51% weighted recall,
outperforming representative pivot language based methods. A
dictionary generated with this method will still need manual
post-editing, but the improved recall and precision decrease the work
of human correctors.

発表者: 東藍 (奈良先端科学技術大学 情報科学研究科 自然言語処理学講座)
題目: 前向き後ろ向きアルゴリズムの一般化
概要: 構造を対象とする機械学習は近年盛んに研究されている.最も単純だが
重要な構造のクラスとして系列があり,系列に対する 機械学習は特に系列ラベ
リングなどと呼ばれている.この系列ラベリングを行う上で,しばしば可能な
全ての系列に対す るある種の和を計算する必要が生じる.たとえば,確率モデ
ルのパラメタ推定などにこの種の和の計算が必 要とされる.この和を,全ての
可能な系列を陽に列挙して定義どおりに計算する のは実際上不可能である.前
向き後ろ向きアルゴリズムは,この計算を動的計画法により効率 的に実行する
アルゴリズムであるが,このアルゴリズムが適用できる和の形式は非常に限定
的である.以上の背景を踏まえて,本発表では前向き後ろ向きアルゴリズムの
一般化を提案する.この一般化により,従来よりも格段に幅広い種類の和を動
的計画法 で効率的に計算することが可能となる.タスク毎に個別に提案されて
きた既存のアルゴリズムのいくつかがこの一般化の特殊な場合として直ちに導
出できることを示し,ま た,この一般化の将来的な応用の展望について議論す
る.

会場に関する連絡先: 村上浩司 (kmurakami -at- is.naist.jp)

※なお、終了後に忘年会を予定しております。ご参加希望の方は8日(火曜日)
までに、村上までご連絡ください。西大寺〜新大宮、もしくは生駒辺りのお店
を考えています。
作成日2009/11/10タイトル第8回 東大・東工大合同勉強会(T2 meeting)by: hashimoto
第8回 東大・東工大合同勉強会(T2 meeting)

日時:2009/11/19(木) 18:30 - 20:00
場所:東京工業大学 大岡山キャンパス 西8号館6F会議室

発表者:野呂 智也 (東工大 徳田研)
題目:同一内容を扱うニュース記事間の差異の検出とニュース閲覧システムの試作

概要:
現在,通信社,新聞社,放送局など様々な組織がWeb上で大量のニュースを配信している.Google NewsやYahoo!Newsなどは,記事をカテゴリごとに分類したり類似内容(トピック)の記事をまとめたりすることによって,大量の記事を効率的に閲覧できるようにしているが,1つのカテゴリやトピックに入る記事数が依然として多く,まだ十分とは言えない.そこで,同一内容を扱う記事間にも差異が存在することに注目し,それを検出する手法について研究を行っている.本発表ではその手法について説明し,試作した閲覧システムを紹介する.
作成日2009/10/27タイトル第一回 奈良先端大・NICT合同勉強会 (N2ミーティ
ング)URL
by: hashimoto
第一回 奈良先端大・NICT合同勉強会 (N2ミーティング)

日時: 2009/10/30(金) 16:00-18:00
場所: 独立行政法人 情報通信研究機構 知識創成コミュニケーション研究センター 役員会議室
     京都府相楽郡精華町光台3-5
     http://kccc.nict.go.jp/access.html

発表者: 中川哲治 (独立行政法人 情報通信研究機構 知識創成コミュニケーション研究センター 知識処理グループ)
題目: グラフカット法のチュートリアル
概要: 近年,画像処理等の分野でグラフカットと呼ばれる最適化手法が利用されており,
     自然言語処理にも応用されている.この手法は,ある種のエネルギー関数が定義
     されたMarkov Random Fieldに対して大域的な最適解を効率的に求めることができ
     る.このグラフカット法についてその応用例とともに紹介する.

発表者: 吉川克正 (NAIST D1)
題目: Unsupervised Markov Logicによる意味解析研究の動向とその応用
概要: 近年,教師なし学習手法を利用した研究は,統語構造だけで なく意味的関係の
     解析においても広がっており,ラベル無しデータから知識を獲 得するだけでな
     く,その知識を質問応答などに応用した上で評価する研究も見ら れはじめてい
     る.本研究では,教師なし学習手法の中でもMarkov Logicを 利用した研究を中
     心に選び,調査するとともに,考えられる高度な意味解析への応用方 法を模索・
     提案する.

会場に関する連絡先: 河原大輔(dk at nict.go.jp)

※ なお、終了後に養老乃滝(未定)近辺で懇親会を予定しています。懇親会に参
加される方はご連絡いただけると幸いです。
 12|