Mistral AI的小3个:MacBook中持有的法国AI

谁说,大型AI的大型模型应该是资源中的美食家?当然不是Mistral AI,它刚刚推出了Small 3,这是一个240亿个参数,能够打开简单的MacBook。

即使中国与DeepSeek一起制作了头版,美国仍然处于最高状态,我们不仅会记住来自法国人。

法国人工智能继续其权力迅速上升。 Mistral AI刚刚发布了Small 3,该语言模型有望在握住笔记本电脑时与该行业的巨人竞争。

凭借其240亿个参数,小3被定位为包括4o-Mini GPT在内的专有模型的认真替代品。但是,最大的印象是它可以在配备32 GB RAM的MacBook上操作的能力。

轻巧的赌注

Mistral的选择必须减少模型的层数,尤其不是任何部分。这种方法使得在不牺牲精度的情况下获得更快的答案是可能的。在MMLU测试中得分超过81%(评估模型推理能力的标准基准),Small 3证明了我们可以做得更少的事情。

特别有趣的是,这些性能是在不诉诸于加强或合成数据的情况下获得的。一种与DeepSeek R1这​​样的竞争对手形成鲜明对比的方法,并且可以在培训过程中提供更大的透明度。

米斯特拉尔(Mistral)在多个领域赞扬了小3的能力:发现欺诈,法律建议,健康……雄心勃勃的应用程序,这些应用程序仍然引发了一些问题。

如果面对Gemma-2 27b和Qwen-2.5 32B等模型,人类测试似乎很有希望,那么对Llama-3.3 70B和GPT-4O Mini的结果将更加细微。

米斯特拉尔(Mistral)通过认识到他的模型在人类评估中的限制来表现出罕见的透明度,这可能会根据测试人员而有所不同。

在Apache 2.0许可下,该模型的开源性质也很强,尤其是在DeepSeek的消息之后。它不仅可以研究和改进模型,而且可以使其适应特定需求。它为其成功做出了很大的贡献。

米斯特拉尔(Mistral)表明,我们可以期望看到更多不同尺寸的模型”在未来几周内具有加强推理能力»。

同时,您可以在huggingface上访问小3ICI

拥抱