SRPO - 腾讯混元开源的先进文生图模型
SRPO是腾讯混元推出的先进的文本到图像生成模型,模型用语义相对偏好优化技术,将奖励信号与文本条件相结合,支持动态调整奖励信号,能更好地适应不同任务需...
Qwen3-Next - 阿里通义推出的新一代混合架构大模型
Qwen3-Next是阿里通义推出的新一代混合架构大模型,具有强大的长文本处理能力和高效的推理速度。模型融合Gated DeltaNet和Gated Attention技术,能快速处理长...
FireRedASR - 小红书开源的工业级语音识别模型系列
FireRedASR 是小红书 FireRed 团队开源的工业级自动语音识别(ASR)模型家族。包含两种核心结构:FireRedASR-LLM 和 FireRedASR-AED。前者采用 Encoder-Adapt...
文心大模型X1.1 - 百度最新推出的深度思考模型
文心大模型X1.1是百度推出的先进的人工智能语言模型。模型基于深度学习和混合强化学习技术,具备强大的语言理解与生成能力。
混元图像2.1 - 腾讯开源的高质量文生图模型
混元图像2.1是腾讯推出的开源文生图模型,基于先进的技术实现高质量的图像生成。模型支持原生2K分辨率,能精准呈现复杂的场景细节、人物表情和动作,展现出极...
UnifiedTTS - 免费的一站式文本转语音API服务平台
UnifiedTTS 是提供一站式文本转语音(TTS)服务,统一的 API 接口平台。整合多种主流的 TTS 服务,包括 Microsoft Azure、MiniMax、阿里云和 ElevenLabs 等。...
AntSK FileChunk - 免费AI文档切片工具,确保上下文连贯
AntSK FileChunk 是智能文档切片工具,专为 RAG(检索增强生成)应用设计。以语义为核心,将文档智能切分为语义完整、连贯的片段,支持多语言,可动态调整切...
WeKnora - 微信团队开源的文档理解与语义检索框架
WeKnora 是腾讯微信团队开源的文档理解与语义检索框架,基于大语言模型(LLM)。专为处理结构复杂、内容异构的文档而设计,采用模块化架构,融合多模态预处理...
MiniCPM 4.1 - 面壁智能推出的端侧大模型
MiniCPM 4.1 是面壁智能推出的专为端侧设备优化的高效大语言模型。具备卓越的推理性能,能在智能手机、平板电脑等设备上快速响应用户请求,推理速度比同尺寸...
Qwen3-ASR-Flash - 阿里推出的高精度语音识别模型
Qwen3-ASR-Flash 是阿里巴巴最新推出的通义千问系列高精度语音识别模型,基于 Qwen3 基座模型,经海量多模态数据训练而成。支持 11 种语言和多种口音,包括普...
XTuner V1 - 上海人工智能实验室开源的大模型训练引擎
XTuner V1 是上海人工智能实验室开源的新一代大模型训练引擎,专为超大规模稀疏混合专家(MoE)模型训练设计。基于 PyTorch FSDP 开发,通过显存、通信和负载...
Seedream 4.0 - 字节最新推出的AI生图模型
Seedream 4.0 是字节跳动最新推出的图像创作模型,为创作者提供高效、可控的创作体验。模型支持精准指令编辑,用户能用日常语言描述需求,模型能准确完成增删...