学习AI

MiniCPM 4.1 - 面壁智能推出的端侧大模型

MiniCPM 4.1 是面壁智能推出的专为端侧设备优化的高效大语言模型。具备卓越的推理性能,能在智能手机、平板电脑等设备上快速响应用户请求,推理速度比同尺寸...

Qwen3-ASR-Flash - 阿里推出的高精度语音识别模型

Qwen3-ASR-Flash 是阿里巴巴最新推出的通义千问系列高精度语音识别模型,基于 Qwen3 基座模型,经海量多模态数据训练而成。支持 11 种语言和多种口音,包括普...

XTuner V1 - 上海人工智能实验室开源的大模型训练引擎

XTuner V1 是上海人工智能实验室开源的新一代大模型训练引擎,专为超大规模稀疏混合专家(MoE)模型训练设计。基于 PyTorch FSDP 开发,通过显存、通信和负载...

Seedream 4.0 - 字节最新推出的AI生图模型

Seedream 4.0 是字节跳动最新推出的图像创作模型,为创作者提供高效、可控的创作体验。模型支持精准指令编辑,用户能用日常语言描述需求,模型能准确完成增删...

rStar2-Agent - 微软开源的14B参数数学推理模型

rStar2-Agent是微软开源的高性能数学推理模型,专为解决复杂数学和科学问题设计。模型在AIME24数学推理测试中以140亿参数达到80.6%的高准确率,展现出卓越的...

OneCAT - 上海交大联合美团推出的新型多模态模型

OneCAT是美团推出的新型统一多模态模型,采用纯解码器架构,能无缝集成多模态理解、文本到图像生成和图像编辑功能。在处理高分辨率图像输入和输出时表现出色...

Qwen3-Max-Preview - 阿里通义千问推出的旗舰大模型

Qwen3-Max-Preview 是阿里通义千问团队推出的最新旗舰大模型。是 Qwen3 系列中参数量最大的模型,参数规模超过 1 万亿。在推理、指令跟随、多语言支持和长尾...

FineVision - Hugging Face发布的开源视觉语言数据集

FineVision 是Hugging Face 发布的开源视觉语言数据集,为训练先进的视觉语言模型。包含 1730 万张图像、2430 万个样本、8890 万轮对话和 95 亿个答案标记。...

Claudable - 开源AI Web应用构建工具,支持即时预览

Claudable是开源的Web应用构建工具,基于Next.js,结合了Claude Code和Cursor CLI的先进AI代理能力,以及Lovable简单直观的应用构建体验。用户只需用自然语言...

HunyuanWorld-Voyager - 腾讯推出的超长漫游3D世界模型

HunyuanWorld-Voyager是腾讯推出的先进的3D世界生成模型,具备从单张图片生成用户自定义相机路径的3D点云序列的能力,能创造出3D一致的场景视频,为用户带来...

Hunyuan-MT-7B - 腾讯开源的轻量级翻译模型

Hunyuan-MT-7B 是腾讯混元发布的轻量级翻译模型,参数量为70亿,支持33个语种及5种民汉语言/方言的互译,包括粤语、维吾尔语、藏语等。模型采用完整的训练范...

Step-Audio 2 mini - 阶跃星辰开源的端到端语音模型

Step-Audio 2 mini是阶跃星辰推出的开源端到端语音模型。突破传统语音模型结构,采用真端到端多模态架构,直接将原始音频输入转化为语音响应输出,时延更低,...
1 2 3 4 8