- <担当授業>
- 知識科学基礎
- 情報処理II
- 社会情報入門I
木村 泰知教授
KIMURA Yasutomo
自然言語処理の観点から政治や金融の課題を解決する
自然言語処理に関する研究をしています。自然言語処理 (NLP; Natural Language Processing) は、日本語や英語のように自然発生した言語をコンピュータが人間のように操れるようになることを目指した研究・技術の総称です。自然言語処理の研究では、機械学習や深層学習などの技術を活用し、実際の問題(タスク)を解決することを目指しています。例えば、自然言語処理のタスクには、文章を他の言語に翻訳する機械翻訳、テキストをカテゴリーに分類する文書分類、質問に対して適切な回答を返す質問応答などがあります。
最近では、これらの自然言語処理のタスクを大規模言語モデル(LLM; Large Language Model)で解けるようになってきました。大規模言語モデルは、2022年11月にOpenAIが公開したChatGPTの普及にともないメディアからも注目されるようになりました。日々進化している大規模現モデルですが、自然言語処理の全ての課題が解決されたわけではありません。特に、重要な課題として、生成過程がブラックボックスであることによる説明性の課題があることや、誤情報や偽情報などの生成による安全性・信頼性の課題があることが指摘されています。
このような課題に対して、地方議会の会議録を対象に政治家の発言に含まれる政治用語の表記揺れや曖昧性の問題を解決しつつ発言の根拠となる記事や一次情報との紐づけを行う研究や、有価証券報告書に含まれる説明文を対象に根拠となる数値を表形式データから抽出する研究を進めることで、説明性、安全性、信頼性の課題解決を試みています。
言語的な視点から課題を解決する楽しさ
大学生のときに、仮名漢字変換や自動翻訳についての講義を聞いたのが、自然言語処理に興味を持ったきっかけです。
日本語をスマートフォンで入力する際に、ひらがなやカタカナで入力された文字列を適切な漢字に変換する仮名漢字変換の処理でも、単語境界、単語選択、未知語処理、個人適応などのさまざまな課題を解決する必要があります。例えば、「なにかとうさんくさい」という平仮名が入力された場合、「何か父さん臭い」「何かと胡散臭い」「なに加藤さん臭い」などの候補が考えられます。これらの変換候補は状況によって正解になりえるのが悩ましいところです。私たちが日頃使用している言葉は、一見簡単に見えるのですが、コンピュータ上で実装する場合には、膨大なデータ処理や高度なアルゴリズムが必要になります。
自然言語処理の魅力の一つは、私たちの身近にある課題が研究テーマになる点だと思います。毎日利用するスマートフォンにも、多くの自然言語処理技術が活用されています。日常的に使用するアプリの中で課題を見つけることもあるでしょう。そのような課題を研究テーマにできることが、この分野の大きな魅力だと思います。
おしゃべりするキャラクターによる観光調査
小樽市の観光問題についての調査をするために、音声合成のキャラクター「小春六花」を用いて調査を行いました。この研究では、観光の問題を明らかにすることを目指して、小春六花とのやり取りする対話履歴から、課題を抽出するというものです。小春六花は、小樽商科大学をモデルにした架空の高校「小樽潮風高校」に通う設定の女子高生です。本研究では、2023年9月に開催されるスタンプラリーに合わせて小樽観光案内システムを作成することで、ChatGPT を活用した小春六花による小樽観光案内システムを運河プラザに設置して、観光者の動向を調査しました。3000件以上の質問をしてくれました。そのなかには、観光についての質問が多く含まれ、お薦めの場所を聞いていました。
複数の研究分野を対象にできる
自然言語処理の研究は、日本語や英語のような言語を対象としているため、文系学生にとっても身近であり、取り組みやすい分野です。特に、政治学や経済学、社会言語学といった分野との境界領域での研究は、データに基づいて新たな知見を得るための強力なツールとなります。
例えば、商学分野に対して、自然言語処理を用いた分析も可能です。有価証券報告書のような文章から企業の財務情報や経営戦略を抽出し、経済やビジネスの動向を深く理解することができます。文系学生にとって、これらの技術は、専門分野におけるデータの扱いや、社会現象や経済活動を新しい視点で捉える力を身につけることができます。このような分析をするために、プログラミングや統計の知識を学び、技術と分野知識の融合を図ることが重要になります。
研究的思考で自分のアイデアをカタチにする
ゼミでは、社会情報学科の強みである人工知能や情報処理の技術を活かして、大学周辺の問題を解決する活動をしています。例えば、「商大生のための時間割」「小樽商大の魅力を4コマ漫画で伝えるマンガ」「小樽商大の3Dマップ/キャンパスビュー」「ドローンによる小樽の撮影」「Vtuber NOIちゃんによる情報発信」「小樽商大を舞台にした双六ゲームの開発」「就活を支援するキャリアプロジェクト」「謎解きLINEゲーム」などがあります。
このようなプロジェクトを通して、学生には課題を論理的かつ体系的に分析する「研究的思考」を身につけてもらいます。研究的思考とは、現在の時代背景を正確に把握し、その時代特有の課題を発見し、従来の取り組みを調査して問題点を明らかにし、その問題を解決する方法を提案・実装するプロセスです。このプロセスは研究のアプローチそのものであり、未知の問題に対して解決する方法を学ぶことになります。
関連リンク