電子機器

ChatGPT 対 Gemini: 現実世界のテストで驚くべき結果が判明

DailyWiz の調査では、7 つの実際のテストで ChatGPT Plus と Gemini Advanced が対戦し、驚くべきパフォーマンスの変化と AI の優位性に対する挑戦的な仮定が明らかになりました。

DailyWiz Editorial··4 読了·378 閲覧
ChatGPT 対 Gemini: 現実世界のテストで驚くべき結果が判明

AI 対決: インテリジェンスの新時代

人工知能の状況は前例のないペースで進化しており、大規模言語モデル (LLM) は世界中の何百万もの人々にとって不可欠なツールとなっています。この革命の最前線にいるのは、OpenAI の ChatGPT と Google の Gemini であり、この 2 つの巨人は覇権をめぐって熾烈な争いを繰り広げています。 ChatGPT は初期の市場参入と広く採用されているため、初期の認識では ChatGPT が有利になることがよくありますが、DailyWiz の技術チームが実施した最近の 7 つの実際のテストでは、パフォーマンス ダイナミクスの魅力的でしばしば予想外の変化が明らかになりました。

特に Google が 2023 年 12 月に発売された Gemini プラットフォームを OpenAI の確立された ChatGPT の直接の競合相手として推し進めたため、技術コミュニティは何ヶ月にもわたって議論してきました。 2022 年 11 月。当社の包括的な評価は、理論的なベンチマークを超えることを目的としており、プレミアム バージョンである ChatGPT Plus (GPT-4o 搭載)Gemini Advanced (Gemini Ultra 1.5 搭載) を、日常の職業的および個人的な使用を反映した実践的なシナリオで相互に比較しました。 DailyWiz のシニア技術アナリスト、エブリン リード博士が指摘したように、その結果は本当に驚くべきもので、これらの強力な AI アシスタントに関する多くの先入観を覆すものでした。

現実世界のガントレット: テスト パラメーター

私たちの方法論では、両方の AI モデルを、創造性、論理的推論、コーディング熟練度、データの要約、数学的精度、言語翻訳、および多面的な理解。各テストは、速度、精度、一貫性、および全体的な実用性に関して採点されました。たとえばクリエイティブライティングテストでは、両方のAIに持続可能な都市農業に関する500ワードのブログ投稿の下書きを依頼しました。このコーディングの課題には、Python スクリプトのデバッグと、単純な電子商取引プラットフォーム用の新しい関数の生成が含まれていました。 データの要約では、量子コンピューティングに関する 1,500 ワードの科学要約から重要な洞察を抽出する必要がありました。

その他のテストには、複雑な代数方程式を解くこと、技術文書を英語から日本語に翻訳すること、チャートから視覚データを解釈すること (Gemini ではマルチモーダル テスト、ChatGPT ではテキストベースの同等のテスト)、特定の予算と興味の制約に基づいてパーソナライズされた旅行旅程を作成することが含まれます。各シナリオは、それぞれの機能の限界を押し上げるように設計されており、実際のアプリケーションにおける長所と短所を詳細に確認できます。

予期せぬものを明らかにする: パフォーマンスに関する洞察

GPT-4o モデルを備えた ChatGPT Plus は、創造的な文章と一般的な会話の流暢さにおいて予想されるリードを維持し、平均 45 秒でより魅力的で人間らしい散文を生成しましたが、Gemini Advanced は、ChatGPT が伝統的に堅牢であると考えられていた分野で予想外に優れていました。 コーディング チャレンジでは、Gemini Ultra 1.5 は優れたデバッグ機能を実証し、GPT-4o よりも 15% 速く Python スクリプトの修正を特定して提案し、より最適化されたコード スニペットを生成しました。リード博士は、「Gemini の論理構造と構文の理解は驚くほど正確で、多くの場合、開発者の時間を大幅に節約する、より洗練されたソリューションを提供してくれました。」

もう 1 つの重要な驚きは数学的精度テストで起こりました。どちらのモデルも標準的な問題では良好なパフォーマンスを示しましたが、Gemini Advanced は複雑な複数ステップの代数方程式で常に ChatGPT Plus を上回り、エラーが少なく、より明確なステップバイステップの推論プロセスを示しました。ただし、ChatGPT は言語翻訳テストで地位を取り戻し、Gemini のより文字通りの出力と比較して、特に慣用的な表現において、技術文書に対してよりニュアンスがあり文化的に適切な翻訳を提供しました。 Gemini が売上グラフの画像を直接解釈できるマルチモーダル テストは、Gemini に固有の利点をもたらし、ChatGPT のテキストのみの入力よりも迅速かつ直接的な分析を可能にしました。

価格設定、アクセシビリティ、および推奨事項

これらの最先端の AI モデルへのアクセスには、さまざまなオプションが付属しています。一般ユーザーや学生向けに、OpenAI と Google は両方とも強力な無料枠を提供しています。 ChatGPT の基本バージョン (GPT-3.5 を利用) は、OpenAI Web サイト とそのモバイル アプリから直接入手できます。 Google の Gemini Pro モデルは、gemini.google.com から無料でアクセスでき、一部の Google Workspace アプリケーションと統合できます。

高度な機能が必要な場合は、プレミアム サブスクリプションが真の力を発揮します。 ChatGPT Plus は月額 20 ドルで、より強力な GPT-4o モデルへのアクセス、より高い使用制限、より速い応答時間を提供します。同様にGemini Advanced の価格は月額 19.99 ドルで (多くの場合、プロモーション用の無料トライアルが付いています)、ユーザーは高機能の Gemini Ultra 1.5 モデルにアクセスできます。通常、サブスクリプションはそれぞれのプラットフォームを通じて直接管理されます。

私たちの推奨事項: クリエイティブな専門家、コンテンツ作成者、そして微妙な会話や魅力的な散文を優先する人にとって、ChatGPT Plus は依然として有力な候補です。。説得力のある物語を生成し、さまざまな文体に適応するその能力は、依然としてベンチマークです。しかし、堅牢な論理的推論、正確なコーディング支援、強力な数学的問題解決を必要とするソフトウェア開発者、データ サイエンティスト、ユーザーにとって、Gemini Advanced は驚くほど強力で、 しばしば優れた選択肢として浮上しました。これらの技術領域でのパフォーマンスは、Gemini を分析タスクに最適なツールにするための Google の多大な投資を示しています。最終的に、「最良の」AI は個々のワークフローと特定のタスク要件に依存し、両方とも今日のデジタル ツールキットに不可欠なツールとなります。

Recommended

* We may earn a commission from qualifying purchases at no extra cost to you.

Comments

No comments yet. Be the first!

関連記事

ユーロビジョンが地域の音楽シーンに火をつけるために東:アジア版を拡大

ユーロビジョンが地域の音楽シーンに火をつけるために東:アジア版を拡大

象徴的なユーロビジョン ソング コンテストが史上初のアジア版を立ち上げ、韓国やフィリピンを含む 10 か国が集まり、画期的な音楽スペクタクルと文化交流が行われます。

コレステロールのゲームチェンジャー:薬物が心臓発作のリスクを 31% 削減

コレステロールのゲームチェンジャー:薬物が心臓発作のリスクを 31% 削減

強力なコレステロール低下薬であるエボロクマブは、高リスクの糖尿病患者の初発心臓発作と脳卒中を驚くべき31%減少させることが実証されており、現在の予防戦略に挑戦を示しています。

塵と腐敗:アフリカ向けUSAIDの数百万もの避妊薬が無駄に

塵と腐敗:アフリカ向けUSAIDの数百万もの避妊薬が無駄に

新たに明らかになった内部メモは、トランプ政権がアフリカ諸国向けの数百万ドル相当の重要な避妊薬を無視し、再配布の明確な選択肢があるにもかかわらず期限切れを放置していた経緯を明らかにしている。

トランプ大統領のオイルタンゴ:市場はついにマエストロに注目しなくなったのか?

トランプ大統領のオイルタンゴ:市場はついにマエストロに注目しなくなったのか?

石油市場は歴史的にドナルド・トランプ氏の発言で大きく変動してきたが、アナリストらは現在、トレーダーらがトランプ氏の影響力に対してあまり反応しなくなっているのではないかと疑問を呈している。

ドイツ、AfD急増の中でシリア難民の帰還を目標に

ドイツ、AfD急増の中でシリア難民の帰還を目標に

CDU党首フリードリヒ・メルツ氏は、反移民感情の高まりとAfDの選挙での勝利を背景に、移民に対するドイツの厳格な姿勢を反映し、シリア難民の最大70%が3年以内に帰国すると予測している。

原材料の見直し:食品産業が激化する中、ケネディ大統領の「勝利」は時期尚早

原材料の見直し:食品産業が激化する中、ケネディ大統領の「勝利」は時期尚早

すべての新しい食品成分を見直すという彼女の野心的な提案が業界の激しい反対に直面しているため、保健長官エレノア・ケネディ博士が連邦食糧政策の勝利を主張するのは時期尚早である。