六中全会

初の「冬季五輪AI手話アナウンサー」がお披露目

人民網日本語版 2021年11月25日13:43

「我々は技術で音の障害を乗り越える」。中央テレビニュースは24日、百度スマートクラウドと共同で中央広播電視総台初のAI(人工知能)手話アナウンサーを正式にお披露目した。同アナウンサーは生身の人間のような肌、髪の毛、目を持ち、親しみやすく自然な印象だ。同アナウンサーは、「私は北京冬季五輪から、年中無休でAIによって聴覚障がい者に手話サービスを提供し、競技の情報をスピーディにお届けします」と述べた。科技日報が伝えた。

ニュースAI手話アナウンサーは百度スマートクラウドの「デジタルスター運営プラットフォーム」から技術的サポートとサービスを受ける。同プラットフォームはデジタルヒューマンとコンテンツの生成を一体化させたプラットフォーム級製品で、テレビ・ラジオ、双方向エンターテインメント、ブランドなどの利用者にワンストップ型のバーチャル司会者、バーチャルアイドル、ブランドイメージキャラクターの生成・運営サービスを提供し、デジタルバーチャルヒューマンの導入ハードルを下げることができる。

同プラットフォームは現在、2D・3Dの高精度で複数種類のデジタルヒューマンのスタイルの生成をサポートしており、フルスタックのAI能力により2Dデジタルヒューマンの「一文生成」を実現するだけでなく、任意の単一2Dフェイスにより高精度3Dフェイスを再構築し、バーチャルヒューマンのフェイス3D模型の編集を行うことにより、任意の2Dフェイスを低コストで3Dバーチャルヒューマンに置き換え、2Dデジタルヒューマンスタイルの豊富さに欠けるという弱点・難点を解消するうえ、AI駆動の高精度3Dデジタルヒューマンの生成期間を3ヶ月から1週間に短縮する。

コンテンツ生成の面については、生身の人間による駆動、AIによる駆動、融合駆動など複数のライブ配信方式をサポートする。生身の人間がいるシーンで多様化したコンテンツを含む動画をスピーディに生成する。顔の4Dデータ(3D+時系列)に基づく高精度デジタルヒューマンの「文字から形状へのモードを跨ぐ表情生成技術」により、口の動きの合成の精度は98.5%になっている。

中央テレビニュースAI手話アナウンサーが身につける語彙は「国家通用手話辞典」の基準に基づくもので、長時間のスマート学習により視聴者に専門的で正確な手話解説を提供できる。(編集YF)

「人民網日本語版」2021年11月25日

最新ニュース

注目フォトニュース

コメント

| おすすめ写真

ランキング

  • 全部
  • 経済
  • 社会
  • 政治