rStar2-Agent - 微软开源的14B参数数学推理模型

rStar2-Agent是微软开源的高性能数学推理模型,专为解决复杂数学和科学问题设计。模型在AIME24数学推理测试中以140亿参数达到80.6%的高准确率,展现出卓越的...

OneCAT - 上海交大联合美团推出的新型多模态模型

OneCAT是美团推出的新型统一多模态模型,采用纯解码器架构,能无缝集成多模态理解、文本到图像生成和图像编辑功能。在处理高分辨率图像输入和输出时表现出色...

Qwen3-Max-Preview - 阿里通义千问推出的旗舰大模型

Qwen3-Max-Preview 是阿里通义千问团队推出的最新旗舰大模型。是 Qwen3 系列中参数量最大的模型,参数规模超过 1 万亿。在推理、指令跟随、多语言支持和长尾...

FineVision - Hugging Face发布的开源视觉语言数据集

FineVision 是Hugging Face 发布的开源视觉语言数据集,为训练先进的视觉语言模型。包含 1730 万张图像、2430 万个样本、8890 万轮对话和 95 亿个答案标记。...

Claudable - 开源AI Web应用构建工具,支持即时预览

Claudable是开源的Web应用构建工具,基于Next.js,结合了Claude Code和Cursor CLI的先进AI代理能力,以及Lovable简单直观的应用构建体验。用户只需用自然语言...

HunyuanWorld-Voyager - 腾讯推出的超长漫游3D世界模型

HunyuanWorld-Voyager是腾讯推出的先进的3D世界生成模型,具备从单张图片生成用户自定义相机路径的3D点云序列的能力,能创造出3D一致的场景视频,为用户带来...

Hunyuan-MT-7B - 腾讯开源的轻量级翻译模型

Hunyuan-MT-7B 是腾讯混元发布的轻量级翻译模型,参数量为70亿,支持33个语种及5种民汉语言/方言的互译,包括粤语、维吾尔语、藏语等。模型采用完整的训练范...

Step-Audio 2 mini - 阶跃星辰开源的端到端语音模型

Step-Audio 2 mini是阶跃星辰推出的开源端到端语音模型。突破传统语音模型结构,采用真端到端多模态架构,直接将原始音频输入转化为语音响应输出,时延更低,...

MobileCLIP2 - 苹果开源的端侧多模态模型

MobileCLIP2是苹果公司推出的开源高效端侧多模态模型,在多模态强化训练方面进行了优化,通过在DFN数据集上训练性能更优的CLIP教师模型集成和改进的图文生成...

InternVL3.5 - 上海AI Lab推出的开源多模态大模型

 InternVL3.5(书生·万象3.5)是上海AI Lab开源的多模态大模型。模型在通用能力、推理能力和部署效率上全面升级,提供从10亿到2410亿参数的九种尺寸版本,覆...

FastVLM - 苹果开源的视觉语言模型

FastVLM(Fast Vision Language Model)是苹果公司推出的视觉语言模型。以FastViTHD混合视觉编码器为核心,融合了卷积和Transformer架构,可显著减少视觉toke...

Meeseeks - 美团开源的评测集,评估模型的指令遵循能力

Meeseeks 是美团 M17 团队开源的大模型评测集,能评估模型的指令遵循能力,通过三级评测框架,从宏观到微观全面衡量模型是否能严格按照用户指令生成回答,不...
1 3 4 5 6 7 13