AIを社会に直接応用する人たちからの「啓示」

AIを社会に直接応用する人たちからの「啓示」

AI を自然言語処理に適用することは、これまでも、そして現在も世界中で発展の傾向にあり、人々のコミュニケーション言語の違いによって生じるギャップを解消するのに役立っています。世界をリードする携帯電話の開発・製造業者の1つであるサムスンは、初のGalaxy AI携帯電話シリーズにAI機能を開発・搭載することで、このトレンドに追いついた。コミュニケーションの際の言語の壁はもうありません。Galaxy AI の通話翻訳機能は最大 13 言語の翻訳をサポートしており、SRV は Galaxy AI におけるベトナム語の研究開発の R&D センターであることを誇りに思っています。

SRV エンジニアリング チームのベトナム語での Galaxy AI 研究開発プロジェクトの AI 機能への貢献には、音声認識と音声からテキストへの変換における AI アプリケーションが含まれます。 Galaxy AI デバイスは、自動音声認識によってユーザーが使用している言語を自動で認識し、音声内容 (Speech) をテキスト (Text) に変換して、次の処理の入力データとして使用します。オンデバイスでは、データはデバイス上で完全にプライベートに保たれます。 AI を適用して、ソース言語からターゲット言語に翻訳します。入力データは上記の ASR 自動音声認識モジュールからのもので、出力はターゲット言語(ターゲット言語、つまりユーザーが翻訳したい言語)に翻訳されたテキストデータです。 AIを使用してテキストを音声に変換します。入力はテキスト(翻訳済み)であり、出力はそのテキストから読み取られた音声です。

2023年、Samsungが写真編集アプリケーションに初めてGenerative AIの適用を導入したことで、SRVのエンジニアリングチームは、モバイル写真編集ソフトウェア(フォトエディター)の多くのスマート機能の開発と完成に重要な役割を果たしました。たとえば、写真内のオブジェクトを別の位置に移動する(デバイスは画像内のオブジェクトを自動的に分析、削除、再配置し、オブジェクトを削除した後に画像の欠落部分を再作成します)。画像の拡大(デバイスは、サイズを変更するときに画像部分を再現し、レイアウトを調整し、欠落した背景部分を完全に埋め、コンテンツが元の画像の境界を超えても、画像の表示領域を拡大します)。画像の解像度を高めます (品質を低下させることなく画像の解像度を向上させます)。

このプロジェクトについて、サムスンベトナム研究開発センターの言語AI研究グループ責任者であるエンジニアのトラン・トゥアン・ミン氏は次のように述べています。2023年10月、Galaxy AI人工知能システムがGalaxy S24電話シリーズ向けに開発されており、当初の計画では英語、中国語、フランス語など、世界で人気の言語が対象となっていました。サムスングループの経営陣は、ギャラクシーAIにベトナム語を追加することを決定した。これまでにユーザー数と世界での人気度に基づいて選択された言語と比較すると、ベトナム語のユーザー数は少なくなっています。これは、ベトナムが重要な市場であり、サムスンの開発計画において戦略的な位置を占めていることを示しています。サムスンベトナム研究開発センター(SRV)は、同グループから信頼され、Galaxy AIにおけるベトナム語の研究開発の任務を任されたことを誇りに思っています。

SRV は、この任務を受けてすぐに、さまざまな部門から機械学習、ディープラーニング、自然言語処理の経験者を集め、言語 AI 研究グループを設立しました。

「SRVがAI関連の戦略的プロジェクトを受注したのはこれが初めてだったので、AIチームに選ばれたときの喜びは今でも覚えています。さらに特別なことは、今や最も近代的な電話回線であるS24スマートフォンで、母国語であるベトナム語を開発できたことを非常に誇りに思うことです。SRVのリーダーシップは、AIをサムスングループだけでなくSRVの研究開発の焦点と位置付けていました。そのため、AIチームには、露出、学習、迅速な技術移転という最高の条件が与えられました。AI研究開発チームのエンジニアは、AIモデルアーキテクチャ、AI用アルゴリズム、AIトレーニング、AI用データに関する移転を受けるため、韓国とインドに派遣されました。さらに、AIテスト部門は、AIに関する知識、テスト方法、テストサポートツール、AIテストの経験を共有するために直接韓国に派遣されました。

さらに、高品質の AI を開発するには、大規模で多様かつ管理されたデータ ソースが前提条件となります。英語、中国語など世界で人気の言語のデータと比較すると、ベトナム語のデータソースははるかに少ないです。これが私たちが直面している最大の課題です。さらに、「嵐はベトナム語の文法ほど悪くない」と言われるほどベトナム語の文法は非常に難しい問題であるだけでなく、方言、俗語、同義語、借用語、GenZ世代の新語などにも関わる多くの困難に直面しました。これらの問題を解決するために、SRVはAIのデータ処理に何百人もの人材を動員しなければなりませんでした。 AI をトレーニングし、AI が理解して正確な出力を得られるよう、継続的にデータを生成しなければなりません。特に、これらのデータ ソースは法的に安全でなければならず、単に自由に収集されたデータであってはなりません。

プロジェクトへの集中度が高く、大量のリソースが動員されたおかげで、非常に短い時間で、既存のデータを調整し、AI トレーニングに役立つ大量の新しいデータを作成することができました。たとえば、Galaxy S24 シリーズをベトナムの人々にとってよりスマートなものにするために、何百万もの男性と女性の音声ファイルを録音しました。

テストに関しては、正確な翻訳とさまざまな騒音環境での音声認識を保証するために、ラボ環境でテストを実施するだけでなく、ホアンキエム湖、ショッピングモール、カフェなど多くの場所に行き、実際のユーザー環境でAI機能が適切に動作することを確認しています」とエンジニアのトラン・トゥアン・ミン氏は語った。

また、エンジニアのトラン・トゥアン・ミン氏によると、彼らのたゆまぬ努力のおかげで、SRV のエンジニアはわずか 4 か月でゼロから技術を習得し、S24 製品ライン向けのベトナム語向け AI を完成させたとのことです。

優れたコア技術には、音声入力とテキスト出力の自動音声認識などがあります。これは、Galaxy AI で最も難しい部分です。これは、機械に人間の言語を理解させることに似ています。英語-ベトナム語と韓国語-ベトナム語の 2 つの言語ペアをサポートする翻訳。テキスト読み上げ

「研究チームのエンジニアと同様に、テスト部門のエンジニアも今ではすべてのAI機能のテストプロセス全体を担えるようになりました。そして、企業からの指導とトレーニングを受ける立場から、テスト部門は仕事を習得し、テストプロセスと経験を東南アジア諸国に伝える役割を担っています」と、エンジニアのトラン・トゥアン・ミン氏は誇らしげに語りました。

ソフトウェア開発部門ディレクターのド・ドゥック・ドゥン氏は次のように語っています。「ギャラクシーAIは、ベトナムのエンジニアが参加した最初のグローバルプロジェクトではありません。以前は、現在のサムスンベトナム研究開発センターの前身であるサムスンベトナムモバイル研究開発センター(SVMC)でグローバルプロジェクトに参加していました。SVMCは2012年に設立され、ハノイのPVIビルにありました。この名前によると、当時は携帯電話向けの技術ソフトウェアソリューションの開発にのみ焦点を当てていましたが、サムスンベトナム研究開発センターにより、モバイルデバイスだけでなく、ノートPCや通信機器にも事業領域が拡大しました。これは、サムスンベトナム研究開発センターの継続的な成長を示しています。」

また、ド・ドゥック・ドゥン氏によれば、技術移転に関しては、担当分野ごとに毎年、韓国だけでなく世界中のサムスンR&D部門から技術移転を受けているとのこと。そして昨年以来、サムスンは、グループの最先端かつ最重要技術であるAIをベトナムに移転することで、ベトナムを生産拠点としての役割を超えて、サムスンの世界的な戦略的な研究開発拠点にすることを決定した際の政府との約束を守っている。

「また、サービス需要の増加に伴い新技術の開発も進んでいますが、新技術の開発は最終的には基礎技術のサポートがあってこそ実現できます。SRVは現在、製品開発中心のR&Dから専門性の高い深掘りR&Dへの変革を目指しています。そして2022年からは、ソフトウェア分野ではマルチメディアとセキュリティの2つを深掘り研究の重点分野として選び、人材育成に力を入れています。また、ノートPCと通信機器の2つの分野でハードウェア分野の開発規模が拡大した際には、ハードウェア設計の専門能力を向上させるためのトレーニングにも力を入れていきます」とド・ドゥック・ズン氏はさらに語った。

<<:  4月11日の朝、米ドル価格は再び上昇した。

>>:  グリーン経済開発 - 港湾都市に新たな市場を開拓する鍵

推薦する

世界のAI専門家2,000人以上を上回り、ベトナムの専門家が優勝

このコンテストは、Kaggle プラットフォーム上の世界最大の AI およびデータ サイエンスの専門...

Android TVをより簡単に使用するための便利なヒント

携帯電話と同様に、Android TV も今日ではほとんどの家庭のリビングルームでますます人気が高ま...

ウクライナ、ロシアの海外資産押収を専門とするグループを設立

プラウダ(ウクライナ)は、ウクライナのデニス・シュミハリ首相が最近、同国政府が海外にあるロシアの国家...

古代フォーヒエンの賑やかな雰囲気を再現

2024年フォーヒエン民族文化祭での龍舞。写真:VNA科学者の研究によると、フォーヒエン遺跡の形成と...

Android Q オペレーティング システムの詳細

Android Q は、現時点で Google の最新オペレーティング システムの 1 つです。将来...

Youtube動画を携帯電話やパソコンに簡単にダウンロードする方法

YouTube は世界的に有名な高品質ビデオ ソーシャル ネットワークとして知られています。ここでは...

沿岸8省市は林業部門の近代化に向けた支援を引き続き受けている

農業農村開発省林業プロジェクト管理委員会副委員長のファム・ホン・ヴィック氏は、首相が林業近代化・沿岸...

20000mAh のパワーバンクは何回充電できますか?

バックアップ充電器は、特に荷送人や旅行者のように頻繁に外出する人にとって、徐々に欠かせないアクセサリ...

Android TV TCL 2019でWifiネットワークに接続する方法の説明

スマート Android TV をネットワークに接続すると、豊富で魅力的なエンターテイメント オプシ...

アルジェリアにおけるベトナムコーヒー製品のプロモーション強化

バブ・エズワールは、45,000 平方メートルの店舗、20,000 平方メートルのオフィス、7,20...

世界知的所有権の日 26/4: イノベーションと創造性を通じて共通の未来を築く

これを受けて、世界知的所有権機関は2024年に「知的財産と持続可能な開発目標:イノベーションと創造性...

バインチュン - ベトナムの旧正月の魂を運ぶケーキ

バインチュンはベトナム人の心の中で特別な位置を占めています。伝説によると、安の侵略者を倒した後、6代...

2024年第1四半期の銀行利益が徐々に明らかに

今年第1四半期の詳細な業績を発表した最初の銀行として、東南アジア商業銀行(SeABank)は、第1四...

見逃せないホリデー クーラー トップ 3

天気はどんどん暑くなり、屋外の気温も上昇し、不快感、無気力、疲労感を感じるようになります。暑さを避け...

アメリカ人男性が水中生活記録を樹立

先週末、キーラーゴにある深さ30フィートのダイビングキャビンの中で、ジョセフ・ディトゥリさんは74日...