#AI #DeepSeek DeepSeek R1T-Chimera 是一种新的开源语言模型,已在 OpenRouter 平台上推出。它是通过合并 DeepSeek-R1 和 DeepSeek-V3 (0324) 创建的,结合了 R1 的推理能力和 V3 的令牌效率改进。它基于 DeepSeek-MoE Transformer 架构,并针对一般文本生成任务进行了优化。该模型合并了来自两个源模型的预训练权重,以平衡推理、效率和指令遵循任务之间的性能。
来源:OpenRouter / Hugging Face / TNG Tech
来源:OpenRouter / Hugging Face / TNG Tech