ディープシーク、特徴は得意分野異なるAI連携、効率化
世界に衝撃を与えた中国のAI企業ディープシーク (DeepSeek)。
生成AIモデルの開発手法は公開されており、専門家は「革新とまでは言えないが、非常に効率的な手法」と言う。
どんな技術が使われているのか。
米オープンAIのChatGPT(チャットGPT)のように、AIがまるで人間と会話ができるような性能を得るには、大量の文章読み込みや人間による採点などの「学習」過程が重要だ。データの準備や人手、高価なAI向け半導体(GPU)による計算など膨大なコストがかかる。
ディープシーク社は昨年12月、まず大規模言語モデル(LLM)「V3」を公開した。論文によると、学習に要したコストは約9億円。単純には比べられないが、数百億円規模とされる米テック大手の開発コストとの差が注目されている。
1月20日には精度を高めた「R1」も発表。V3やR1は無料で使え、日本語でもやりとりできる。
松尾豊・東京大教授は「少し使ってみた感じでは、非常に性能の高いモデルで素晴らしい。チャットGPTとも遜色ないように感じる」と話す。
AI技術としては、2017年に米グーグルのチームが発表した学習方法「トランスフォーマー」が基礎に使われている。チャットGPTを含む従来のLLM技術の延長上にあるとも言える。
三菱総合研究所の高橋怜士・主任研究員は「開発手法が革新的に進化したとは言えないが、様々な工夫を取り入れて非常に効率的なAIになっている」と評価する。
特徴の一つが「混合専門家モデル」と呼ばれる手法だ。一つの大きなAIに頼らず、数学やプログラミング……のように得意分野が異なる小規模のAIを連携させ、学習効率を上げたという。「強化学習」と呼ばれるプロセスでは、正解と不正解が明らかな数学の問題を学習させることで、論理的思考を効率的に身につけさせている。
松尾さんは「チャットGPTでも使われている『教師ありファインチューニング』という過程を大幅に省略している。シンプルな手法で高い性能を実現している点が重要で、興味深い」と言う。
ディープシークの成果は工夫によってテック大手などと勝負ができることを証明したとし、「日本にとっても非常にグッドニュースだ。逆転のチャンスが訪れうることも示している」とみる。
一方で、懸念も広がり始めている。
同社サイトでは、利用者が入力したプロフィルやAIへの質問などの情報は「中国国内の安全なサーバーに保管する」とある。
利用規則には、トラブルには中国の法に基づいて対応するとも書かれている。
個人情報保護委員会は3日、ディープシークの利用に関して「留意すべき点がある」とする注意情報を出した。
利用時に入力した個人情報を含むデータは、中国政府による収集・監視の対象になりうると説明する。
三菱総研の飯田正仁研究員は「入力内容が中国のサーバーに渡る可能性があるため、日本企業に利用が広がるかはわからない。中国で作られたモデルが、どういう挙動をするかも検証が求められるのではないか」と指摘する。
ディープシークをめぐっては欧米メディアがオープンAIの出力データを無断で使った可能性があると報じている。
(出典 : 朝日新聞デジタル)
☞ LINK DeepSeek利用時の注意点
「DeepSeek」開発の中国企業が米の輸出規制対象の半導体を調達か 米当局が調査
2025/02/01
中国の生成AIDeepSeekを開発した企業が、アメリカの対中輸出規制の対象となっている先端半導体を、第三国を迂回して調達した可能性があるとして、アメリカ当局が調査を始めたと報じられた。DeepSeekはアメリカのOpenAIが開発した「ChatGPT」などをしのぐ性能の生成AIを低コストで実現したとして台頭し、アメリカのテック業界に衝撃をもたらした。
ブルームバーグ通信によると、アメリカ政府やFBI=連邦捜査局が、DeepSeekについて対中輸出規制の対象となるエヌビディアの先端半導体をシンガポールを迂回することで調達した可能性があるとして、調査を始めているという。アメリカ政府はこれまで安全保障上の懸念を理由に、半導体をはじめとするアメリカの先端技術が中国の手に渡らないよう規制を強めてきたが、DeepSeekの台頭でアメリカ議会ではトランプ政権に対して「抜け穴」対策を含めた規制強化を求める声があがっている。
最後までお読みいただき、有り難うございました。 ☚ LINK
*** 皆さんからの ご意見・ご感想など 『
※ メール・BLOG の転送厳禁です!!
よろしくお願いします。
コメントをお書きください