学习博客 | 第 4 页

AnyI2V - 复旦联合阿里达摩院等推出的图像到视频生成框架

AnyI2V是复旦大学联合阿里巴巴达摩院等机构推出的创新图像动画生成框架，能将静态图像（如网格、点云）转化为动态视频，无需大量训练数据，支持用户自定义运...

学习AI

9个月前

SRPO - 腾讯混元开源的先进文生图模型

SRPO是腾讯混元推出的先进的文本到图像生成模型，模型用语义相对偏好优化技术，将奖励信号与文本条件相结合，支持动态调整奖励信号，能更好地适应不同任务需...

学习AI

9个月前

Qwen3-Next - 阿里通义推出的新一代混合架构大模型

Qwen3-Next是阿里通义推出的新一代混合架构大模型，具有强大的长文本处理能力和高效的推理速度。模型融合Gated DeltaNet和Gated Attention技术，能快速处理长...

学习AI

9个月前

FireRedASR - 小红书开源的工业级语音识别模型系列

FireRedASR 是小红书 FireRed 团队开源的工业级自动语音识别（ASR）模型家族。包含两种核心结构：FireRedASR-LLM 和 FireRedASR-AED。前者采用 Encoder-Adapt...

学习AI

9个月前

文心大模型X1.1 - 百度最新推出的深度思考模型

文心大模型X1.1是百度推出的先进的人工智能语言模型。模型基于深度学习和混合强化学习技术，具备强大的语言理解与生成能力。

学习AI

9个月前

混元图像2.1 - 腾讯开源的高质量文生图模型

混元图像2.1是腾讯推出的开源文生图模型，基于先进的技术实现高质量的图像生成。模型支持原生2K分辨率，能精准呈现复杂的场景细节、人物表情和动作，展现出极...

学习AI

9个月前

UnifiedTTS - 免费的一站式文本转语音API服务平台

UnifiedTTS 是提供一站式文本转语音（TTS）服务，统一的 API 接口平台。整合多种主流的 TTS 服务，包括 Microsoft Azure、MiniMax、阿里云和 ElevenLabs 等。...

学习AI

9个月前

AntSK FileChunk - 免费AI文档切片工具，确保上下文连贯

AntSK FileChunk 是智能文档切片工具，专为 RAG（检索增强生成）应用设计。以语义为核心，将文档智能切分为语义完整、连贯的片段，支持多语言，可动态调整切...

学习AI

9个月前

WeKnora - 微信团队开源的文档理解与语义检索框架

WeKnora 是腾讯微信团队开源的文档理解与语义检索框架，基于大语言模型（LLM）。专为处理结构复杂、内容异构的文档而设计，采用模块化架构，融合多模态预处理...

学习AI

9个月前

MiniCPM 4.1 - 面壁智能推出的端侧大模型

MiniCPM 4.1 是面壁智能推出的专为端侧设备优化的高效大语言模型。具备卓越的推理性能，能在智能手机、平板电脑等设备上快速响应用户请求，推理速度比同尺寸...

学习AI

9个月前

Qwen3-ASR-Flash - 阿里推出的高精度语音识别模型

Qwen3-ASR-Flash 是阿里巴巴最新推出的通义千问系列高精度语音识别模型，基于 Qwen3 基座模型，经海量多模态数据训练而成。支持 11 种语言和多种口音，包括普...

学习AI

9个月前

XTuner V1 - 上海人工智能实验室开源的大模型训练引擎

XTuner V1 是上海人工智能实验室开源的新一代大模型训练引擎，专为超大规模稀疏混合专家（MoE）模型训练设计。基于 PyTorch FSDP 开发，通过显存、通信和负载...

学习AI

9个月前

AnyI2V - 复旦联合阿里达摩院等推出的图像到视频生成框架

SRPO - 腾讯混元开源的先进文生图模型

Qwen3-Next - 阿里通义推出的新一代混合架构大模型

FireRedASR - 小红书开源的工业级语音识别模型系列

文心大模型X1.1 - 百度最新推出的深度思考模型

混元图像2.1 - 腾讯开源的高质量文生图模型

UnifiedTTS - 免费的一站式文本转语音API服务平台

AntSK FileChunk - 免费AI文档切片工具，确保上下文连贯

WeKnora - 微信团队开源的文档理解与语义检索框架

MiniCPM 4.1 - 面壁智能推出的端侧大模型

Qwen3-ASR-Flash - 阿里推出的高精度语音识别模型

XTuner V1 - 上海人工智能实验室开源的大模型训练引擎

最新文章

随机推荐