計算言語学

ウィキペディアから、無料の百科事典
ナビゲーションにジャンプ 検索にジャンプ

計算言語学は、自然言語の計算モデリングおよび言語学的問題への適切な計算アプローチの研究に関係する学際的な分野です。一般に、計算言語学は、とりわけ、言語学コンピューターサイエンス人工知能数学論理哲学認知科学認知心理学心理言語学人類学神経科学を利用しています。

サブフィールドおよび関連分野

伝統的に、計算言語学はのエリアとして浮上人工知能によって実行されるコンピュータ科学者の処理にコンピュータのアプリケーションに特化した自然言語形成と計算言語学協会(ACL)[1]及び単独の会議シリーズの設立、1970年代と1980年代に連結フィールド。

計算言語学のための協会は、計算言語学をとして定義しています。

...の科学的研究、言語、計算の視点から。計算言語学者は、提供に興味を持っている計算モデル、言語現象の様々な種類のを。[2]

用語「計算言語学では、」この頃(2020年)のほぼ同義語であると解釈され、自然言語処理(NLP)と(ヒト)の言語技術これらの用語は、実用的なアプリケーションではなく、理論的な問い合わせの側面に及び、2000年代以来、強い重点を置きます。実際には、彼らは大幅にNLP / ACLコミュニティにおける用語「コンピュータ言語」を交換した、[3]彼らは、具体的にのみ、適用された計算言語学のサブフィールドを参照してくださいが。

計算言語学は、両方の理論と応用のコンポーネントがあります。理論計算言語学の課題に焦点を当て、理論言語学と認知科学。[4]応用計算言語学は、人間の言語の使用をモデル化する実用的な成果に焦点を当てています。[4]

理論計算言語学の正式な理論の開発が含ま文法構文解析)とセマンティクスが多いに根ざし、正式なロジックシンボリック知識ベースをアプローチ)。理論的な計算言語学によって研究されている研究の分野は次のとおりです。

適用される計算言語学は、によって支配されている機械学習、伝統的に使用して、統計的手法をすることによって2010年代半ば以降、ニューラルネットワーク:Socherら。(2012)[5]は早かったディープラーニングのACL 2012でのチュートリアル、そして最も参加者の両方の関心と(当時)懐疑的に会いました。それまでは、神経の学習は、基本的理由は、統計的解釈可能性の欠如の拒絶されました。2015年までは、深い学習がNLPの主要な枠組みへと発展していました。タスクが適用される計算言語学によって対処については、参照して自然言語処理の記事を。これは、の設計などの古典的な問題を含んでいますPOS-タガー(品詞タガー)パーサのための自然言語のような、またはタスク機械翻訳(MT)、コンピュータは、言語間の翻訳持つ扱う計算言語学のサブ部門。計算言語学の最も初期の最も困難なアプリケーションの一つとして、MTは、多くのサブフィールドと理論と応用の両方の側面を描画します。伝統的に、自動言語翻訳は、計算言語学の悪名高いハード支店と考えられてきました。[6]

理論的言語学と応用計算言語学の間の二分法とは別に、次のようなさまざまな基準に従った主要な領域への計算の他の分割が存在します。

  • 話されているかテキストであるかにかかわらず、処理される言語の媒体:音声認識音声合成は、コンピューターを使用して話された言語をどのように理解または作成できるかを扱います。
  • タスクが実行され、例えば、言語(認識)または分析するかどうかを合成する言語(世代):解析と世代が離れて言語を取り、それを一緒に入れて、それぞれ扱う計算言語学のサブディビジョンです。

伝統的に、言語学の他の分野の研究問題に対処するためのコンピューターのアプリケーションは、計算言語学内のタスクとして説明されてきました。他の側面の中で、これには含まれます

  • コンピュータ支援コーパス言語学談話分析の分野における詳細な進歩を作るための方法として、1970年代から使用されてきた、[7]
  • 歴史言語学/言語年代学における言語進化のシミュレーションと研究[8]

起源

計算言語学は、多くの場合のフィールド内でグループ化された人工知能が、人工知能の開発の前に存在していました。計算言語学は、自動的に英語に外国語、特にロシアの科学雑誌からのテキストを翻訳するためにコンピュータを使用するために1950年代に米国での努力で始まりました。[9]コンピュータが作ることができるので、算術より速く、より正確に人間より(体系的)な計算を、それらはまた、プロセス言語に開始できるまでの時間が短い問題であると考えられていました。[10]計算および定量的な方法は、言語の家族に現代語とサブグループ化する現代語の以前の形式の未遂復興に歴史的に使用されています。以下のような以前の方法、語彙統計学言語年代学は、時期尚早と不正確であることが証明されています。しかし、最近の学際的研究の生物学的研究、特にからの借用概念という遺伝子マッピングは、より洗練された分析ツールと、より信頼性の高い結果を生み出すことが証明されています。[11]

場合は、機械翻訳(機械的訳語として知られているが)すぐに正確な翻訳をもたらすことができなかった、人間の言語の自動処理は、はるかに複雑元々想定されていたよりも、として認識されました。計算言語学の発展に専念研究の新しいフィールドの名前として生まれたアルゴリズムインテリジェント言語データを処理するためのソフトウェアと。用語「計算言語学」自体が最初で鋳造されたデビッド・ヘイズ、両方の創立メンバー計算言語学協会(ACL)計算言語学に関する国際委員会(ICCL)。[12]

ある言語を別の言語に翻訳するには、形態論(語形の文法)と構文(文型の文法)の両方を含む、両方の言語の文法を理解する必要があることが観察されました。構文を理解するには、セマンティクスレキシコン(または「語彙」)、さらには言語使用の語用の何かも理解する必要がありました。このように、言語間の翻訳の取り組みとして始まったものは、コンピューターを使用して自然言語を表現および処理する方法を理解することに専念する完全な分野に発展しました。[13]

今日、計算言語学の部門で行われる計算言語学の範囲内で研究[14] 計算言語学研究所、[15] コンピュータサイエンス学科、[16]及び言語学部門。[17] [18] 他の人がヒューマン・マシン・インタラクションを可能システムを作成することを目指しながら取り組んでスピーチやテキスト処理システムを作成するために、計算言語学の目的の分野でいくつかの研究。ヒューマン・マシン・コミュニケーションのために意味のプログラムが呼び出され、会話エージェント[19]

アプローチ

計算言語学がさまざまな分野の専門家によって、そして幅広い部門を通じて実行できるのと同じように、研究分野もさまざまなトピックをブローチすることができます。発達言語学、構造言語学、言語学、生産、および言語理解:次のセクションでは、談話の4つの主要なエリアに分かれてフィールド全体にわたる利用可能な文献のいくつかを議論します。

発達的アプローチ

言語は、個人の生涯を通じて発達する認知スキルです。この発達過程は、いくつかの技術を用いて検討されてきた、との計算方法は、そのうちの一つです。人間の言語の開発は、それが難しく、それを理解するための計算方法を適用するために作るいくつかの制約を提供します。例えば、中に言語習得、人間の子供たちは、主にのみ正の証拠にさらされています。[20]この手段は、個々の言語発達の間、正しい形式が何であるかの唯一の証拠が提供されず、正しくない何の証拠。これは、言語のような複雑な情報のための手順をテスト単純仮説のための十分な情報である[21]そのため、個人の言語開発と習得をモデル化するための計算アプローチに一定の境界を提供します。

計算の角度から子供たちの言語習得の発達過程をモデル化する試みがなされており、統計文法とコネクショニストモデルの両方につながっています。[22]この領域での作業は、歴史を通して言語の進化を説明する方法としても提案されています。モデルを使用して、子供がより良い記憶とより長い注意期間を発達させるにつれて、段階的に提示される単純な入力の組み合わせで言語を学ぶことができることが示されました。[23]これは同時に、人間の子供の発達期間が長い理由として提起された。[23]両方の結論は、人工ニューラルネットワークの強さのために導き出されましたプロジェクトが作成しました。

言語を開発する乳児の能力はまた、ロボットを使用してモデル化されている[24]言語理論をテストするために。子どもたちは、モデルが基づいて作成された可能性があるとして学ぶために有効アフォーダンス行動、認識、および効果の間のマッピングが作成され、話し言葉にリンクされたモデル。重要なことに、これらのロボットは、文法構造を必要とせずに機能する単語から意味へのマッピングを取得でき、学習プロセスを大幅に簡素化し、情報に光を当てて、言語開発の現在の理解を促進しました。この情報だけで経験的計算手法を用いてテストされている可能性があることに注意することが重要です。

ニューラルネットワークと学習ロボットシステムを使用して、生涯における個人の言語発達の理解が継続的に向上するため、言語自体が時間とともに変化し、発達することを覚えておくことも重要です。この現象を理解するための計算アプローチは、非常に興味深い情報を発掘しました。価格方程式ポリアの壷のダイナミクスを使用して、研究者は将来の言語の進化を予測するだけでなく、現代の言語の進化の歴史への洞察を与えるシステムを作成しました。[25]このモデリングの取り組みは、計算言語学を通じて、他の方法では不可能だったであろうことを達成しました。

計算言語学の進歩により、人間の言語発達と進化の時間全体の理解が素晴らしく向上したことは明らかです。システムを自由にモデル化および変更する機能により、科学は、そうでなければ手に負えない仮説をテストする倫理的な方法を得ることができます。

構造的アプローチ

言語のより良い計算モデルを作成するには、言語の構造を理解することが重要です。この目的のために、英語は、言語が構造レベルでどのように機能するかをよりよく理解するために、計算アプローチを使用して綿密に研究されてきました。言語構造を研究できる最も重要な要素の1つは、大規模な言語コーパスまたはサンプルの可用性です。これにより、計算言語学者は、モデルを実行するために必要な生データを取得し、単一の言語に含まれる膨大な量のデータに存在する基礎となる構造をよりよく理解できます。最も引用されている英語の言語コーパスの1つは、PennTreebankです。[26]例えばIBMのコンピュータのマニュアルや転写の電話での会話など、広くさまざまなソースから派生し、このコーパスは、アメリカ英語の450万人以上の単語が含まれています。このコーパスは、主に使用して注釈が付けられている品詞タギングおよび構文ブラケットおよび言語構造に関連する実質的な経験的な観察をもたらしました。[27]

言語の構造体への理論的アプローチも開発されています。これらの作品は、計算言語学が無数の方法で言語の理解を促進する仮説を立てるためのフレームワークを持つことを可能にします。内部に、元の理論的な論文の一つの文法と言語の構造は、モデルの2種類を提案しました。[21]これらのモデルでは、ルールまたはパターンは、それらの出会いの頻度と強度の増加を学びました。[21]どのように幼児が具体的かつ非正規文法(学ぶん:仕事も答えに、計算言語学者のための質問に作成さチョムスキー標準形をovergeneralizedバージョンを学習して立ち往生なしに)?[21]このような理論的努力は、研究の方向性を研究分野の生涯の早い段階で設定し、分野の成長に不可欠です。

言語の構造情報は、テキスト発話のペア間の類似性認識の発見と実現することができます。[28]例えば、最近、ヒト談話のパターンにおける構造情報の存在に基づいて、概念的なことが証明された再発プロットはモデルに使用され、データの傾向を視覚化し、天然のテキスト発話間の類似性の信頼性の尺度を作成することができます。[28]この技術は、ヒトの構造プロービングのための強力なツールである会話をこの質問への計算アプローチがなければ、談話データで大幅に複雑な情報存在は、科学者がアクセスできない残っているだろう。

言語の構造データに関する情報は、英語だけでなく、日本語などの他の言語でも利用できます[29]計算手法を使用して、日本語の文コーパスを分析し、文の長さに関連して対数正規性のパターンを見つけました。[29]このlognormalityの正確な原因は不明のままけれども、それは正確に計算言語学を発見するように設計されたこの種の情報です。この情報は、日本語の基礎となる構造に関するさらに重要な発見につながる可能性があり、言語としての日本語の理解にいくつもの影響を与える可能性があります。計算言語学は、迅速かつ疑いのための非常に小さな部屋で発生する科学的知識ベースに非常にエキサイティングな追加が可能になります。

言語データの構造に対する計算アプローチがなければ、現在利用可能な情報の多くは、単一言語内の膨大なデータの下に隠されたままになります。計算言語学により、科学者は大量のデータを確実かつ効率的に解析できるため、他のほとんどのアプローチでは見られないような発見の可能性が生まれます。

生産が近づい

言語の生産は、それが提供する情報と流暢なプロデューサーが持っている必要があります必要なスキルに均等に複雑なようです。言うことです。つまり、理解はコミュニケーションの半分だけの問題です。残りの半分は、システム言語を生成する方法であり、計算言語学は、この分野での興味深い発見をしました。

アラン・チューリング:コンピュータ科学者との同名の開発者チューリングテスト機械の知能を測定する方法として、

1950年に発表された現在有名な論文で、アランチューリングは、機械がいつか「考える」能力を持つ可能性を提案しました。機械における思考の概念を定義する可能性のある思考実験として、彼は、人間の被験者が2つのテキストのみの会話を行う「模倣テスト」を提案しました。 。チューリングは、被験者が人間と機械の違いを区別できない場合、機械は思考できると結論付けることができると提案しています。[30]今日、このテストはチューリングテストとして知られており、人工知能の分野で影響力のあるアイデアであり続けています。

ジョセフ・ワイゼンバウム:元MITの教授で開発されたコンピュータ科学者ELIZA、利用原始的なコンピュータプログラム自然言語処理を

人間と自然に会話するように設計されたコンピュータプログラムの最も初期の最も有名な例の1つは、 1966年MITのJosephWeizenbaumによって開発されたELIZAプログラムです。このプログラムはロジェリアの心理療法士をエミュレートしました。 ユーザーによってもたらさ書かれた文や質問に応答するとき。それに言われたことを理解してインテリジェントに対応できる見えたが、真実で、それは単にだけ各文にいくつかのキーワードを理解することに頼っていたパターンマッチングルーチンを追いました。その応答は、周りに知られている言葉の適切翻訳版を文の未知の部分を再結合することによって生成されました。例えば、フレーズにELIZAは言葉「あなた」と「私」を更新できるように、「あなた[いくつかの単語]私」、ELIZAは「あなた」を理解し、「私」一般的なパターンにマッチした「あなたが私を憎むようです」 「I」と「あなた」と「何があなたが私はあなたを嫌いだと思うのですか?」返信します。この例ではELIZAは、単語「憎悪」の無理解を持っていません[31]

いくつかのプロジェクトは、まだ最初の最初の場所でそのフィールドとして計算言語学をオフに開始した問題を解決しようとしています。しかし、この方法は、より洗練さとなっており、その結果、計算言語学者によって生成された結果は、より多くの啓発になってきました。改善するために、コンピュータの翻訳を、いくつかのモデルには、比較された隠れマルコフモデル、技術を平滑化し、動詞の翻訳にそれらを適用するこれらの特定の改良。[32]の最も自然な翻訳を生成することがわかったモデルドイツ語フランス語をwordsは、一次依存性と出生性モデルを備えた洗練されたアライメントモデルでした。また、提示されたモデルに効率的なトレーニングアルゴリズムを提供し、他の科学者が結果をさらに改善できるようにします。このタイプの作業は計算言語学に固有のものであり、コンピューターによって言語がどのように生成され、理解されるかについての理解を大幅に向上させることができるアプリケーションがあります。

コンピュータがより自然な方法で言語を生成するようにする作業も行われています。ヒトからの言語の入力を使用して、アルゴリズムは、例えば、ヒトからの言語の入力、または礼儀正しさや、任意のようなより抽象的要因などの要因に基づいて生産のシステムのスタイルを変更することができますが構築されている人格の5つの主要な寸法[33]この研究は、経由して、計算のアプローチをとるパラメータ推定作り、我々は個人間で見ると同じように仕事へのコンピュータのためにそれを簡素化言語的なスタイルの広大な配列を分類するためのモデル、人間とコンピュータの相互作用をより自然。

テキストベースの対話型のアプローチ

例えばELIZAとして人間とコンピュータの相互作用の最も早いと最も単純なモデルの多くは、コンピュータからの応答を生成するために、ユーザからテキストベースの入力を含みます。この方法により、単語が特定のパターンを認識し、として知られるプロセスを介して、それに応じて応答するために、コンピュータユーザトリガが入力したキーワードスポッティング

音声対話のアプローチ

最近の技術は、音声ベースの対話型システムにさらに重点を置いています。など、これらのシステム、シリIOSのオペレーティングシステムは、テキストベースのシステムと同様のパターン認識技術で動作するが、前者と、ユーザ入力を介して行われる音声認識言語学のこの分野では、ユーザーの音声を音波として処理し、コンピューターが入力を認識するために音響と言語パターンを解釈します。[34]

理解が近づき

現代の計算言語学の焦点の多くは理解です。インターネットの普及と簡単にアクセス書かれた人間の言語の豊富で、できるプログラムを作成する機能の理解、人間の言語が向上し、検索エンジン、自動化された顧客サービス、およびオンライン教育など、多くの広範かつエキサイティングな可能性を持っているでしょう。

読解における初期の研究は、これらのいずれかの可能性が手紙の大辞典は、例えば文字から「学習」によって生成された1959年ブレッドソーとBrowingによって示されるように、光学式文字認識のタスク、その後、確率にベイズ統計を適用含ま例は、新たな入力は、最終的な決定を行うために結合されたマッチを学びました。[35]言語解析にベイズ統計を適用することで他の試みは、Mostellerとで使用される単語の解析たウォレス(1963)のワーク含まザ・フェデラリストはその原作者を決定することを試みるために使用されたが(マディソンは、最も可能性の高いオーサリングと結論付けます論文の大半)。[36]

1971年にテリー・ウィノグラードは早期に開発された自然言語処理の単純なルールに支配環境の中で自然に書かれたコマンドを解釈することができるエンジンを。このプロジェクトでプログラムを解析する第一言語が呼び出されましたSHRDLUが、唯一のタスクのために設計されたおもちゃの環境の範囲内で、それがコマンドを与え、ユーザにより多少自然な会話を行うことができました。この環境はさまざまな形や色のブロックで構成されており、SHRDLUは「持っているブロックよりも高いブロックを見つけて箱に入れる」などのコマンドを解釈することができました。「どのピラミッドの意味かわかりません」などの質問をします。ユーザーの入力に応じて。[37]印象的な一方で、この種の自然言語処理ははるかに困難外におもちゃの環境の限られた範囲を証明しています。同様に、によって開発されたプロジェクトNASAは呼ばLUNARはアポロ計画によって返された月面の岩石の地質学的分析について自然に書かれた質問に対する回答を提供するように設計されました。[38]この種の問題は、と呼ばれる質問応答

理解話し言葉での最初の試みは、未知の信号がパターンを探すために分析される信号のモデリングにおける1960年代と1970年代に行われた作業に基づいていたし、その履歴に基づいて予測を行います。1989年にRabinerによって詳述されるように言語に信号モデリングのこの種を適用する最初の幾分成功したアプローチは、隠れマルコフモデルを使用して達成された[39]であることができるモデルの任意の数の確率を決定するために、このアプローチの試み音声を生成並びにこれらの可能なモデルのそれぞれから生成された様々な単語の確率をモデル化に使用されます。同様のアプローチは、早期に採用された音声認識単語/品詞ペアの確率を使用してIBMに70年代後半に開始する試み。[40]

さらに最近では、統計的アプローチのこれらの種類は、そのような話題識別など、より困難な作業は、テキスト文書内のトピック確率を推測するためにベイズパラメータ推定を使用するために適用されています。[41]

アプリケーション

適用される計算言語学とほぼ同等である自然言語処理エンドユーザーのための応用例としては、AppleのSiriの機能、スペルチェックツール、などの音声認識ソフトウェアが含まれる音声合成しばしば無効発音やヘルプを実証するために使用される、とGoogleなどの機械翻訳プログラムおよびウェブサイトは、翻訳されたプログラムを、。[42]

計算言語学を含む状況にも役立つソーシャルメディアインターネットを、チャットルームやウェブサイトの検索でコンテンツフィルタを提供するために、例えば、[42]を介してコンテンツをグループ化して整理するためのソーシャルメディアマイニング[43]文書検索とクラスタリング。人物検索「赤、大、4輪車は、」赤いトラックの写真を見つけるために、例えば、もし、検索エンジンはまだ、このような「車」と「四輪」と一致する言葉が所望する情報を検索します。[44]

計算の方法はで、また言語学的研究、例えばをサポートするために重要であるコーパス言語学[7]歴史言語学経時変化の研究のためのように、計算方法は、モデリング言語ファミリーの同定に寄与することができる[8] さらに参照量的比較言語学または系統学を)、並びに音の変化のモデル[45]との意味。[46]

レガシー

計算言語学の主題は、大衆文化に繰り返し影響を及ぼしてきました。

も参照してください

参考文献

  1. ^ 「ACLメンバーポータル|計算言語学会メンバーポータル」www.aclweb.org 2020年8月17日取得
  2. ^ 「計算言語学とは何ですか?」計算言語学会。2005年2月。
  3. ^ たとえば、スウェーデンのウプサラで開催されたACL 2010の宴会でのイド・ダガンのスピーチで指摘されたように
  4. ^ B Uszkoreit、ハンス。「計算言語学とは何ですか?」計算言語学とザールラント大学の音声学専攻。
  5. ^ ソッヘル、リチャード。「NLP-ACL2012チュートリアルのディープラーニング」Socher 2020年8月17日取得
  6. ^ エッティンガー、AG(1965)。計算言語学American Mathematical Monthly、Vol。72、第2号、第2部:コンピュータおよびコンピューティング、頁147-150。
  7. ^ B McEnery、トーマス(1996)。コーパス言語学:入門エディンバラ:エディンバラ大学出版。p。114. ISBN 978-0748611652
  8. ^ B Bowern、クレア。「計算系統学」。言語学の年次レビュー4(2018):281-296。
  9. ^ ジョン・ハッチンス:回顧とコンピュータベースの翻訳で見通し。MTサミットVII、1999年、頁30-44の議事。
  10. ^ アーノルドB. Barach:機械翻訳1975:や変更が来て。
  11. ^ T.クロウリー。、C. Bowern。歴史言語学の入門。オークランド、NZ:オックスフォードUP、1992.印刷。
  12. ^ 「故人のメンバー」ICCLメンバー2017年5月17日にオリジナルからアーカイブされました2017年11月15日取得
  13. ^ リズリディ、エドゥアルドHovy、ジミー・リン、ジョン・バッドミットプラーガー、Dragomirラデフ、ルーシーVanderwende、ラルフWeischedelによって自然言語処理
  14. ^ 「計算言語学と音声学」
  15. ^ 「Yatskoの計算言語学研究室」
  16. ^ "CLIP"
  17. ^ 計算言語学-言語学科-ジョージタウン大学
  18. ^ 「UPenn言語学:計算言語学」
  19. ^ Jurafsky、D.、&マーティン、JH(2009)。音声・言語処理:自然言語処理への導入、計算言語学、および音声認識。ニュージャージー州アッパーサドルリバー:ピアソンプレンティスホール。
  20. ^ Bowerman、M.(1988)。「負の証拠」問題ありません:どのように子供たちが過度に一般的な文法を構築しないようです。言語の普遍を説明します
  21. ^ bはCのD ブレーヌ、MDS(1971)。文法の内在化のモデルの2種類で。理論的な観点:DI Slobin(ED)、文法の個体発生中。ニューヨーク:アカデミックプレス。
  22. ^ Powers、DMW&Turk、CCR(1989)。自然言語の機械学習Springer-Verlag。ISBN978-0-387-19557-5 _ 
  23. ^ B エルマン、ジェフリーL.(1993)。「ニューラルネットワークの学習と開発:小さな開始することの重要性」。認知48(1):71から99。DOI10.1016 / 0010から0277(93)90058から4をPMID 8403835S2CID 2105042  
  24. ^ サルヴィ、G .; モンテサーノ、L .; ディーノ、A .; サントス-ビクター、J.(2012)。「言語のブートストラップ:認知・行動の関連性から単語の意味を学びます」。システム、人間、およびサイバネティクス上のIEEEトランザクション。パートB42(3):660から71。arXivの1711.09714DOI10.1109 / TSMCB.2011.2172420PMID 22106152S2CID 977486  
  25. ^ ゴング、T。; Shuai、L。; タマリス、M.&イェーガー、G.(2012)。E.スカラス(編)。「価格式ポリA-URNダイナミクスを使用して言語の変更を学びます」PLOSONE7(3):e33171。Bibcode2012PLoSO ... 733171GDOI10.1371 / journal.pone.0033171PMC3299756_ PMID22427981_  
  26. ^ マーカス、M.&Marcinkiewicz、M.(1993)。「英語の大規模な注釈付きコーパスの構築:ザ・ペンツリーバンクを」(PDF) 計算言語学19(2):313から330。
  27. ^ テイラー、アン(2003)。「1」。Treebanks春のオランダ。頁5-22。
  28. ^ B アンガス、D .; スミス、A.&ワイルズ、J.(2012)。「概念再発プロット:人間談話における暴露のパターン」(PDF) 可視化とコンピュータグラフィックス上のIEEEトランザクション18(6):988から97。DOI/ TVCG.2011.100 10.1109をPMID 22499664S2CID 359497   
  29. ^ a b 古橋亨&早川恭子(2012)。「日本語の文の長さの分布の対数正規性」。日本物理学会誌81(3):034004。Bibcode 2012JPSJ ... 81c4004F土井10.1143 /JPSJ.81.034004
  30. ^ チューリング、AM(1950)。「計算する機械と知性」。59(236):433–460。土井10.1093 / mind /lix.236.433JSTOR2251299_ 
  31. ^ Weizenbaum、J.(1966)。「人と機械の間の自然言語コミュニケーションの研究のためELIZA-コンピュータ・プログラム」。ACMの通信9(1):36-45。DOI10.1145 / 365153.365168S2CID 1896290 
  32. ^ OCH、FJ; ネイ、H.(2003)。「様々な統計アライメントモデルの系統的比較」計算言語学29(1):19-51。DOI10.1162 / 089120103321337421
  33. ^ Mairesse、F.(2011)。「言語的なスタイルの支配ユーザーの認識:性格特性の訓練可能世代」計算言語学37(3):455から488。DOI10.1162 / COLI_a_00063
  34. ^ 言語ファイル言語学のオハイオ州立大学の学科。2011. pp。624–634。ISBN 9780814251799
  35. ^ ブレッドソー、WW&ブラウニング、I.(1959)。マシンによるパターン認識と読書IRE-AIEE-ACM '59(東) - 12月1-3、1959年、東部共同IRE-AIEE-ACMコンピュータ会議で発表論文。ニューヨーク、ニューヨーク、USA:ACMプレス。PP。225-232。DOI10.1145 / 1460299.1460326
  36. ^ Mosteller、F.(1963)。「原作者の問題に推論」。アメリカ統計学会誌58(302):275から309。DOI10.2307 / 2283270JSTOR 2283270 
  37. ^ Winograd、T。(1971)「自然言語を理解するためのコンピュータプログラムにおけるデータの表現としての手順」(レポート)。2016年11月1日にオリジナルからアーカイブされまし2012年6月15日取得 {{cite journal}}: Cite journal requires |journal= (help)
  38. ^ ウッズ、W .; カプラン、R.&ナッシュ・ウェバー、B.(1972)。「月の科学自然言語情報システム」(報告書)。 {{cite journal}}: Cite journal requires |journal= (help)
  39. ^ Rabiner、L.(1989)。「Aの隠れマルコフモデルのチュートリアルや音声認識で選択したアプリケーション」。IEEEの議事録77(2):257から286。CiteSeerX 10.1.1.381.3454DOI10.1109 / 5.18626 
  40. ^ BAHL、L .; ベイカー、J。; コーエン、P。; Jelinek、F。(1978)。「連続読み自然コーパスの認識」。ICASSP'78。音響、音声、および信号処理に関するIEEE国際会議3. pp。422–424。DOI/ ICASSP.1978.1170402 10.1109を
  41. ^ BLEI、D.&ン、A.(2003)。「潜在的ディリクレ配分」機械学習のジャーナル3:993から1022。
  42. ^ ab 「計算言語学キャリア」 。カリフォルニア州立大学2016年9月19日取得
  43. ^ マルジョ、ルーSら。「Twitterで自動キーワード抽出。」カーネギーメロン大学、NDウェブ。2016年9月19日。
  44. ^ 「計算言語学」スタンフォード哲学百科事典スタンフォード大学形而上学研究所。2014年2月26日検索された4月19、 2017年
  45. ^ Pigoli、ダビデ、ら。「音響音声学的データの分析:話し言葉ロマンス言語の違いを模索。」arXivのプレプリントarXivの:1507.07587 985(2015); グループ、機能系統樹。「機能の値を持つ形質の系統学的推論:。音声の進化」エコロジー&進化27.3の動向(2012):160-166。..
  46. ^ 例えばハミルトン、ウィリアム・L.、ジュール・レスコベック、そしてダンJurafsky。「通時的単語の埋め込みは、セマンティック変更の統計的法則を明らかにしました。」arXivのプレプリントarXivの:1605.09096(2016)。
  47. ^ "「スタートレック」の翻訳者は、最後のフロンティアに到達します」。www.cnn.com。 2020年8月17日閲覧
  48. ^ バダム、ジョン(1983年6月3日)、ウォーゲームは、取得した2016年2月22日を
  49. ^ Hershman-Leeson、Lynn(1999-02-19)、Conceiving Ada 、 2016-02-22を取得
  50. ^ ジョーンズ、スパイク(2014年1月10日)、彼女は、取得した2016年2月18日を
  51. ^ Tyldum、Morten(2014-12-25)、The Imitation Game 、 2016-02-18を取得
  52. ^ Garland、Alex(2015-04-24)、Ex Machina 、 2016-02-18を取得
  53. ^ ビルヌーブ、デニス(2016年10月10日)。「到着」IMDb取得した18年12月2019

さらに読む

外部リンク