サイバーテック、テキストマイニング用AIの教師データ作成サービスを開始
~英語圏となるフィリピンの自社オフショア拠点による、日英の教師データ作成も対応~
ITにより企業のDX化推進をサポートする、株式会社サイバーテック(代表取締役社長:橋元 賢次 本社:東京都渋谷区、以下サイバーテック)は、テキストマイニング用AIシステムの教師データ作成サービスを開始いたしました(開始日:2023年3月6日)。
DX(デジタルトランスフォーメーション)の推進が求められている昨今、AIを活用することによるビジネスモデル改革や業務カイゼンは進んでおり、社会へのインパクトは日増しに大きくなっております。そのような中、SNSで投稿された内容や口コミからの掘り起こし、アンケートに書かれた文章の分析、文章内のおおよその意味を判別するネガポジ判定や、論文などから必要とするテキスト情報を抽出するといった、テキストマイニングにもAIの活用が進んでいます。さらに、自然言語処理技術も進んだ結果、Google翻訳に代表される機械翻訳の性能向上や、話題性の高いAIチャットサービス「ChatGPT」の登場など、コミュニケーション分野におけるAI技術の向上は目覚ましいものがあります。これらのテキスト情報を扱うAIシステムでは、コーパス情報をはじめとする大量の教師データの準備が求められます。
サイバーテックでは、数年前にAIによるゆらぎ検出~ライティング支援エンジンを自社開発したことを皮切りに、フィリピンに有する自社オフショア拠点「セブITアウトソーシングセンター」にて、AIシステム向けのアノテーションサービス「セブ ハイスペック アノテーション」を提供してまいりました。今回リリースした「テキストマイニング用AIシステムの教師データ作成サービス」は、AIによるゆらぎ検出~ライティング支援エンジンでも必要とされた教師データ作成ノウハウをベースに、テキスト情報へのアノテーションサービスをリーズナブルにご提供いたします。
特に、自社オフショア拠点「セブITアウトソーシングセンター」があるフィリピンは、公用語が英語であり、新興国の中でも非常に高い英語力を有する地域となります。したがって、テキストマイニング用AIシステムに用いられる教師データは日本語に限らず、英語による論文や調査記事、英字新聞などといった、英語コンテンツを対象とした教師データ作成も可能です。
DX推進に不可欠!「テキストマイニング用AIシステムの教師データ作成」の特徴
サイバーテックの「テキストマイニング用AIシステムの教師データ作成」サービスの特徴は次の3点となります。
公用語が英語のフィリピンで実施、高い英語読解力で学習データの品質にも直結!
英文に対するアノテーションを実施するうえで、しっかりとした英文の読解力は最低限必要となりますが、弊社が自社オフショア拠点を有するフィリピンは高い英語力を有する人材が多数存在します。その中でもセブ島エリアはフィリピンの首都マニラと比較した場合、おおよそ3分の2の物価であるにもかかわらず、数多くの英語スクールが存在するとともに、オンライン英会話の講師が多く輩出される高い英語力を有する人材が豊富なエリアです。したがって英語テキスト情報に対しても高品質かつリーズナブルなアノテーション作業を行うことが可能です。
在宅スタッフではなく、直接雇用の正社員による、安定したアノテーション品質!
アノテーション作業は、オフィスに出社している直接雇用の正社員が行いますので、社内でFace to Faceによるコミュニケーションを取りながら、高品質のアノテーション作業を実施することが可能です。経験豊富なアノテーションマネージャが進捗管理やチェック体制の構築、指示書の作成や見直しなどを行い、アノテーション経験が豊富なメンバーで構成されたチーム体制での作業となるため、属人的な「バラツキ・誤差」を極力なくし、高品質なテキストマイニング向け教師データ作成を実現します。ちなみに、セブITアウトソーシングセンターには日本人も複数名在籍しておりますので、日本語のテキストを対象としたアノテーションも対応可能です。
ラボ型のメンバー固定で、プロジェクト並走型アノテーションもリーズナブルに可能!
一般的なアノテーション業務委託の形式でもリーズナブルにテキストマイニング用AIシステムの教師データ作成が可能ですが、セブITアウトソーシングセンターの経験豊富なアノテータースタッフやアノテーションチームごと、皆様の企業におけるアノテーション部門としてBynameによるラボ型の要員固定を行っていただくことが可能です。これにより、大規模AIシステムのモデル構築と並走した形で学習データ作成体制を構築することや、長期プロジェクトでのさらなる品質向上とコストダウンを実現することが可能となります。
DX推進に不可欠!「セブ ハイスペックアノテーション」の特徴
サイバーテックが提供する、AIシステム向けのアノテーション作業代行「セブ ハイスペック アノテーション」サービスでは、主に画像データを中心に、次のようなAIシステム向けの学習データ(教師データ)作成を実施してきました。
・セグメンテーション~画像からの領域抽出
・キーポイント付与~画像への特徴点付与
・バウンディングボックス付与~画像からの物体認識
・データセットの分類~クラシフィケーション
・学習データの拡張~データアーギュメンテーション
今後は、ドキュメントソリューション事業と親和性が高い「テキストマイニング用AIシステムの教師データ作成」サービスをラインナップに加えることにより、画像データセットに対するアノテーションに加え、テキストデータに対するAIアノテーションにもサービス対象範囲を広げることになりました。これにより、サイバーテックは、AI分野をはじめ、さらに付加価値の高い自社製品・サービスを提供いたします。
「テキストマイニング用AIシステムの教師データ作成」サービス 紹介ページ
「テキストマイニング用AIシステムの教師データ作成」サービスをご案内するWebサイトは以下となります。
「AIアノテーション・BPO」事業 紹介ページ
「AIアノテーション・BPO」事業をご案内するWebサイトは以下となります。
サイバーテックは、企業の情報化投資において、高い費用対効果とDX対応を実現するソフトウェア製品とITサービスを企業の皆さまに提供しております。今回の取り組みにより、得意とするドキュメンテーション分野と、英語圏オフショアの強みを活かしたAIアノテーションサービスを拡充させる事で、皆様のDX推進のサポートをいたします。
<株式会社サイバーテックについて>
株式会社サイバーテックは「ITによる社会貢献」を目指し、1998年の創業からWeb技術とマークアップ言語に携わってきました。外資ベンダーが多いIT業界の中、純国産ベンダーとして、マニュアルなどのテクニカルドキュメントや構造化文書の作成~管理~配信をはじめ、Web分野・AI分野への情報化投資において、高い費用対効果とDX対応を実現するソフトウェア製品とITサービスを企業の皆さまに提供いたします。
商号:株式会社サイバーテック(CyberTech Corporation)
代表者:代表取締役社長 橋元 賢次
設立:平成10年(1998年)9月8日
本社所在地:〒150-0044 東京都渋谷区円山町20-1 新大宗道玄坂上ビル7階
資本金:5,000万円
URL:https://www.cybertech.co.jp/
事業内容:
ドキュメントソリューション~マニュアルからDX推進と効率化を実現
マニュアルの共同制作・多言語化・組版と電子化を実現するプラットフォーム「PMX」を中心に、企業のDX化を推進します。
URL: https://www.cybertech.co.jp/xml/Webソリューション~安心のWeb運用と高セキュリティの基盤構築
Webコンテンツ運用サービス「サブスクWeb運用」や、基盤運用・セキュリティ対策を中心に、WebリニューアルやCMS導入・マイグレーションまで、幅広いサービスをご提供いたします。
URL: https://www.cybertech.co.jp/websol/AIアノテーション・BPO~プロフェッショナルサービスが1人月10万円~
AI向け学習データ作成サービス「セブ ハイスペック アノテーション」を中心に、データ加工やオフショア開発、英語サポートを、高品質かつリーズナブルにご提供します。
URL: https://www.cybertech.co.jp/ito/
<本件に関するお問い合わせ先>
株式会社サイバーテック 管理部 広報担当:薮田
〒150-0044 東京都渋谷区円山町20-1 新大宗道玄坂上ビル7階
TEL:03-5457-1770 FAX:03-5457-1772
URL:https://www.cybertech.co.jp/ メール:info@cybertech.co.jp