キャリア・マム　理化学研究所関根氏を特別講師に迎えセミナーを開催！LLMの精度に直結するデータを解説

～事例紹介　LLMモデル活用を成功に導くポイントを徹底解説～

2024-07-09 11:45

株式会社キャリア・マム(本社：東京都多摩市、代表取締役：堤香苗)は、2024年7月23日に自然言語処理、LLM構築の先駆者である理化学研究所の関根聡氏を特別講師に招き、ウェビナー「生成AI LLM構築セミナー　～インストラクションチューニングデータ作成時のポイントとその事例～」を開催します。

理化学研究所は、2023年より複数企業との共同研究「LLMのための日本語インストラクションデータ作成プロジェクト」を掲げ、そのデータ制作数は2024年2月末日に1万件に到達。キャリア・マムは、インストラクションデータ制作外注先3社のうちの1社として制作に参加し、広く一般的な質問とそれに対する適切な回答を担当。質の高い日本語に特化したインストラクションデータを作成しました。

実用的な大規模言語モデル(LLM)の構築には、モデルの精度を大きく左右するいくつかのポイントがあります。そのひとつがインストラクションデータの妥当性であり、LLM構築時には、適切なデータの基準を正しく見極め、揃えることを重要視すべきです。

当セミナーでは、今回の開発を具体的な事例とし、インストラクションデータを制作する際に基準となる事項や度合いについて関根氏が解説、後半はパネルディスカッション形式で、データの作成やチューニングに関するコツ、アノテーターに必要な資質や進化していくLLMについて、ご紹介します。

関根氏の解説は、LLM構築におけるインストラクションデータの重要性やデータ作成時のポイントはもちろん、言語AIの最新動向、貴社ビジネスへの適用・応用について知見を得る好機です。AI開発者やビジネス戦略担当者にとって、貴重な情報を得る時間となるでしょう。
また、キャリア・マムがLLMのインストラクションデータ作成を担当できる理由や独自のメソッドは、お客様の新たな気づきの糧となり、事業戦略立案・イノベーション創出をアシストします。

セミナー概要

名称　　：生成AI LLM構築セミナー
　　　　　～インストラクションチューニングデータ作成時のポイントとその事例～
開催日時：2024年7月23日　12:00～12:55
会場　　：オンライン開催
　　　　　(お申し込みいただいた方に、ウェビナーのURLをお送りいたします)
参加費　：無料

＊お申し込みフォーム＊
https://www.c-mam.co.jp/member/app.php?no=4239

プログラム

●第1部

LLM構築時のデータインストラクションの重要性と事例
LLM構築データの安全性確保の重要性とその考え方

特別講師紹介

国立研究開発法人理化学研究所革新知能統合研究センター
言語情報アクセス技術チームチームリーダー
関根聡氏(Ph.D.)

大学卒業後に入社した松下電器産業株式会社(現・パナソニック株式会社)で、生涯のテーマとなる自然言語処理に出会う。その後、1992年に英国マンチェスター大学で修士号を、1998年にニューヨーク大学で博士号を取得後、2007年に同大学の准教授に就任。2024年4月からは情報学研究所LLM研究開発センター特任教授を兼任。自然言語処理技術のなかでも情報抽出、言語的知識獲得、言語解析などの分野で第一人者として知られる。

●第2部
パネルディスカッション「LLM構築時のデータ作成：インストラクションチューニング時のコツ」

インストラクションデータ作成時の事例に基づき、実際の調整内容や作成順序、段階などを紹介します。そのほか、キャリア・マムより納期に合わせた作成までのメンバーアサイン、研修方法、チェック方法などのコツを、理化学研究所革新知能統合研究センターテクニカルスタッフ後藤美知子様より納品されたデータのチェック方法について解説。データ連携の重要性について、パネルディスカッション形式でお話します。

〈登壇者〉
理化学研究所　関根聡氏
理化学研究所　テクニカルスタッフ　後藤美知子氏
株式会社キャリア・マム　制作マネージャー　小尾和美

〈ファシリテーター〉
株式会社キャリア・マム　代表取締役　堤香苗