快訊

    真的假的?阿里巴巴發布「通義千問」旗艦版 宣稱優於DeepSeek

    2025-01-29 15:55 / 作者 國際中心
    阿里巴巴旗下的阿里雲發布AI模型「通義千問」旗艦版模型Qwen2.5-Max,並聲稱在測試中優於DeepSeekV3。翻攝百度
    中國新創公司DeepSeek推出最新AI模型震撼全球科技界後,中國阿里巴巴集團旗下的阿里雲今日發布最新「通義千問」旗艦版AI模型,聲稱表現優於DeepSeekV3。

    多家中國網路媒體今日報導,阿里雲AI模型「通義千問」旗艦版模型Qwen2.5-Max正式發佈。該模型預訓練資料超過20萬億tokens。目前,開發者可在Qwen Chat平台免費體驗模型,也可以登錄 Qwen Chat 進行體驗,例如直接與模型對話,或者使用 artifacts、搜索等功能。

    阿里雲表示,用戶不必進行繁瑣的文檔分割,該模型可記住更長的對話歷史紀錄,實現更連貫、更自然的交互體驗,也可更佳理解代碼、複雜推理、多輪對話等。

    據報導,阿里雲也直接對比Qwen2.5-Max和DeepSeek V3、GPT-4o 和 Claude-3.5-Sonnet等AI引擎的性能表現。報導說,在 Arena-Hard、LiveBench、LiveCodeBench 和 GPQA-Diamond 等基準測試中,Qwen2.5-Max 的表現超越了 DeepSeek V3,同時在 MMLU-Pro 等其他評估中也展現出了極具競爭力的成績。

    阿里巴巴旗下的阿里雲發布AI模型「通義千問」旗艦版模型Qwen2.5-Max,並聲稱在測試中優於DeepSeekV3。翻攝百度


    DeepSeek V3乃DeepSeek於去年12月公布的AI模型版本,而本月稍早公布的DeepSeek R1因聲稱可以只用極低成本,訓練出和美國巨頭OpenAI匹敵的AI引擎而震撼全球。
    國際中心 收藏文章

    本網站使用Cookie以便為您提供更優質的使用體驗,若您點擊下方“同意”或繼續瀏覽本網站,即表示您同意我們的Cookie政策,欲瞭解更多資訊請見