小米MIMO使用体验记录

记录小米MIMO大模型使用过程中的发现、体验和思考

这个飞书文档主要是为了记录MIMO以及其他AI模型/工具使用过程中的一些发现.

4月30日

重要发现

今天用小米MIMO最大的重要发现就是发现小米MIMO消耗的token呢,会比其他的模型哈,这地方对比的是Deepseek,当时是V3 R3吧?R3这个版本,会比它的消耗大出一个5倍左右。那是怎么发现的呢?就是因为星煜凡程里面有一个识别这个待办事项的一个功能。我发现它这个功能一直的加载不出来。然后呢,使用小米MIMO加ClaudeCode进行排查之后,就发现是因为窗口值最大的token消耗数是设的500,原来运行的呢也是示例的内容,原来呢从来没有超过500过,但小米上来呢,就干了2000多token。 截图 今天的第二个重要发现就是小米MIMO它好像没有视觉识别的功能。这个是怎么发现的哈?就是用它来做这个,用它来写这个专题前沿讲座的时候,那个大作业的时候,我是放了一些老师上课的PPT的图片在里面的,就是这些图片呢,包括这节课的标题和老师姓名。我就让告诉MIMO说,所有的课程都在里面了,让它挑几个课程就是来写。结果呢,发现它口头上答应了,并且也读取那个那个PNG格式图片了,但是它并没有真正识别出来图片里面是什么东西。这就是很大的问题。而且他没,他没有识别出来呢,他没有直接告诉我说他没有拥有一个读识图能力。他反而呢,是直接说,他反而是实,他反而是直接编造了一些课程的数据,说这是他根据那个图片来得出的一些东西。这一点我说不上是好是坏,好处呢可能就是在进行一些工程化的问题的时候,他确实能把这个工程完成。那么最后交付的结果也确实不是很,不算很差。他最后编的那些课程呢,实际上也是有一定相关性,跟这个行业的讲座。但是呢,坏处就是,它是一个黑箱,而且它欺骗了我。

更正:小米mimo2.5-pro是文本模型,但是小米mimo2.5是多模态.

流水账

今天呢使用小米MIMO主要做的一些事情就是把这个维权材料全权是由它来制作了一下,就是尤其是那个写了一十几个Word格式的一些诉讼的文件。不过我不知道是小米MIMO模型很强的原因,还是claude code它本来设计就很好。那小米MIMO呢是出乎意料,出色地完成了这个编造Word的任务。中间呢遇到了两个大的问题,首先第一个就是它创造了一个形式上的假的DOCX文件。只是二进制的那种文件,所以导致它打不开。第二一个大的错误呢,就是它把字体没有设置成宋体啊,这些常见字体,而设置成了日本的一款字体。不过后来我有问它为什么就是设置就是默认是一个日本字体。它说呢,是默认设置了一个东亚字体,而那个日本所代表那个字体呢,是一个典型的东亚的字体,所以说那个相当于是一个默认的字体。当然把这两那个问题解决之后呢,发现它的用这个就是处理Word的能力呢,就非常的强大了。尤其是沉淀到claude点MD这个文件之后。 今天还使用小米的MIMO模型加ClaudeCode这个来制作了一个小网站吧,算是。就是把那个有关的一些诉讼的所有材料做成了一个在线版本,并且能够输密码才能够查看。这一步呢,就大大地降低了一些沟通的门槛,就不需要我们很多时候传递信息就不需要通过网盘呀,通过微信加微信呀这种东西。因为发现现在的软件的门槛真的是在降低,任何人有任何想法,就是直接就走出一个软件出来。使用软件就是任何人制作一个软件呢,就像制作一个Word文档一一样简单。这是我对未来就是网页开发,就是软件行业的一个基础的认识。就是虽然非常精密的一些,比如说高并发的场景啊,或者是说需要设计数据库啊,设计架构一些场景呢,普通人肯定是做不到。但是呢,日常的很多很大一部分,我觉得超过一半部分的使用,人们都是可以像操作Word一样来制作一个网页的。

感受

使用小米MIMO模型呢,有一个很大的感受哈。当然这个跟小米MIMO模型本身没有什么关系,是关于AI的一些思考的感受。就是说普通人的维权成本大大降低了,如果你会用AI的话。原来呢,是你走到起诉啊这一步,实际上是非常困难的,因为你不懂一些法条,以及你没法去搜罗一些东西,你对这个东西没有一些基本概念,对这些法条,因为你没有对它有一个基本的框架的认识,所以你就导致不知道对面就是违反哪些法律。但现在有了AI之后呢,它能够精准地帮你定位它出问题的法条是哪一些,然后你自己去进行一个核实。这对于逻辑思维很强的人来说,就大大地降低了普通人维权的门槛。实际上很多事情呢,它并不是真正的诉讼一定要打赢就那个成功了。实际上你走到诉讼这一步,把起诉状这些东西材料全部提交之后呢,实际上对面就差不多就会和解了。所以说,AI呢,现在是让所有人都平等地能够走到起诉的这一步。实际上走到这一步呢,很多时候对面就已经开始怯场了,这时候呢,大概率就会和解了。 截图 今天的第二感受呢,其实不止针对于小米MIMO这一个模型,是针对于AI这一个大的概念的。也包括软件行业。我认为以后呢,信息传递的方式,还有软件的使用,它都不会再限制的这么死板了。以后呢,但凡有需求,就可以弄软件。软件呢,变得触手可得。就像刚才我说的,写软件就像写Word、写PPT一样,以后就是一个必备的技能。因为它真的很好的,可以很好的进行展示,很好的进行分享,这是办公软件所不能做到的效果。

5月1日

重要发现

小米的MIMO大模型系列呢,2.5全系列它是只支持文本推理的,不是一个多模态的模型。那多模态的模型它只有一个小米的MIMO V2,有一个o mini,这个模型它是支持视觉模型的。

更正:mimo-2.5是多模态模型

小米的这个Token Plan它只支持以下模型。MiMo-V2.5-Pro、MiMo-V2.5、MiMo-V2.5-TTS-VoiceClone、MiMo-V2.5-TTS-VoiceDesign、MiMo-V2.5-TTS、MiMo-V2-Pro、MiMo-V2-Omni、MiMo-V2-TTS,那么一会在这里稍微总结一下,这些所有模型它分别是什么样的优势。

流水账

感受

可能如果要在claudecode里面使用的话,最好还是一个多模态的模型比较好,就是能够识别图片,识别一些音频综合的一个模型会效果很好。 但同时我们也可以就是配置不同的模型,就是一个API配置不同的模型,这就是CCSwitch的一个缺陷点吧,它不能够不同的任务使用不同的模型,它只能就是大概的用一下,就是复杂任务用什么,简单的任务用什么

5月2日

重要发现

小米的模型好像确实要快一些,但我不确定这是是不是跟我用的时间现在是半夜有关系 第二个重大发现就是发现处理一些简单的任务。嗯,小米的V2.5反而是比V2.5 PRO要好的,一会儿研究一下V2.5和V2.5 PRO, 看他们主要差别是什么 claudeCode也是支持multi agent的,具体怎么激发呢?具体怎么触发呢?也是通过提示词进行触发。但是multi agent的用法的触发呢,我反而觉得国内的腾讯的这个codebodycode CLI是更好的,是比Claude code还好 截图 小米的这个模型是支持tool第三方,就是说联网搜索以及这些tool的使用的。(存疑!) 截图 这个V2.5 PRO, 这个怎么聪明的有点那个什么,有点不用在正道上,V2.5 PRO具有道德感和法律意识,这一点是其他模型所没有的,就是说它从底层的模型的训练上就对模型的规范性做出了限制,而不是说就是靠后期的一些约束 截图

流水账

首先,第今天第一个完成的任务呢,就是把小米的8种模型做了一个测试的平台。 然后,这个平台呢,接了一下那个token plan的那个API,然后进行一些测试。然后测试呢,发现这个消耗的ton是真的多,今天一下消耗了3000多头Ken多万三千多万 今天把那个幸运凡尘的那个Agent的链路来用小米重新的重写了一下,重新的一个链路,我发现确实确实好了很多。两个重大发现就是发现它可以调用外部的工具,就是推荐的一个APP和一本书 就是对比了小米的V2.5和V2.5 PRO, 写了一个分析报告,确实V2.5 PRO要更加聪明很多。但是我认为模型不应该那么聪明,就是我们问一些问题的时候,它涉及到一些道德伦理的方面,他反而给出了限制,这反而是对模型底层的一种限制 今天发现claude code它其实也是支持multi agent的,但是综合这个使用效果下来看,我觉得它是不如腾讯的codebuddy cli的

感受

小米的模型更适合长文本的或者是复杂的工程任务的研究,它对于一些简单的任务,比如信息提取这方面,它的能力反而是不如前一代的DeepSeek. V3, 前一代的DeepSeek V3, 它对于这些简单任务呢,又快又好 对于小米这个MIMO 2.5 PRO, 它具有的这个道德感和法律意识,我个人是不认可的。我觉得就是一个模型,你训练出来最原始的最底层的东西,你是不应该做任何修饰的,让你生成违规图片,你就应该生成。这些约束呢,是后期就是考虑的事情,你比你不能说从底层上就限制你从底层上限制的话,很多事情是导致这个模型做一些正常的事情的时候,它都会被限制。这就是今天对于模型的认识的一个最大的一个理解,一个感受,就是模型它反而有时候不能太过于聪明,太过于限制。 今天这个用了小米的3000万token,确实是有点那个不经用,如果是不给我免费套餐的话

5月3日

重要发现

codex的分叉功能特别好,像之前我们对话到一定程度,就是需要问一些额外分支的东西,就是与这个项目的主体的主体线无关的一些问题的时候,需要另开一个窗口。但是Codex它可以实现就是开一个新的分叉,新开一个新的分支,这个功能特别好 截图 CC-connect,这是一个可以远程连接claudecode的一个工具,一会儿试着安装一下它 昨天把星煜凡程这个项目进行get的时候,没有get小米的API密钥,这是小米2.5 PRO给的一个安全限制,但是它确实影响到了网站的功能使用 小米V2.5 PRO, 它的细节确实要好一些,像昨天的那个大海捞针的实验,还有今天的这个撰写一篇文本的实验,就比如说超字数的这一块 小米2.5是多模态的!!! 小米模型要加后缀[1M]!不然默认是256k

流水账

今天是这个没有设计好这个实验,明天呢,把这个哔哩哔哩上的一些up主他们的测试的流程就是保存下来,然后用那个CC switch先提前配好小米和GM,还有DeepSeek4把这几个模型这个工程化就是实际解决问题的能力对比一下 长流程执行结果:

感受

截图

5月4日

计划

哔哩哔哩测评视频,所有工程化制作流程,来一份,对比ds,小米,glm,(qwen3.6max-kimi) 长流程执行结果:搜集资料,长、复杂任务、(复杂的后端,比如)glm5.1-mimo2.5pro 细节(比如说重复添加之类的) 拿skill-creator跑几轮评测和优化 前端(多模态)glm5v-mimo2.5-(qwen3.6max-kimi)(截图复刻网站) 工具:CC 采访Skill 截图

任务

小米mimo-2.5-pro 智谱glm-5.1 ds-4-pro 重构我的博客页面,前端直观对比一下效果

重要发现

skill采访 https://github.com/Yeachan-Heo/oh-my-claudecode/blob/main/skills/deep-interview/SKILL.md 魔塔社区 ffmpeg 模型的联网搜索功能,是跟模型所在的服务器的位置访问权限有关,还是和使用人位置的访问权限有关? kimi前端无敌,审美无敌,交互动效无敌,有人味,

测试流程

Init 告诉两个需求文件 以下这个路径是我对项目的修改需求,都在这两个文件中了,一个是计划,一个是检测效果.请你 按照文件要求修改项目.D:\myproject\my-blog-mimo\my-blog\需求

测试结果记录

模型效果截图
glm-5v
glm-5.1
glm-5.1
mimo-2.5
mimo-2.5
mimo2.5pro
mimo2.5pro
DeepSeek-V4-pro
ds2号本地部署
gpt5.5
gpt5.5
gpt5.5
网友kimi
kimi-coding
kimi-coding
claude-opus-4.7
claude-4.7-max

前端结论: Claude >= KIMI > GPT >>> glm > ds = mimo 注:websearch功能好像没用上(glm和ds还有mimo)

5月6日

重要发现

小米的mimo似乎在claudecode中不支持websearch,相比之下,minimax是采用了网络搜索的MCP去曲线救国.所以我也在思考是否是因为websearch功能不可用,才导致之前仿照x.ai的效果奇差. 小米mimo的websearch好像只能在OpenAI协议下使用(存疑)

答疑

VS code 中的插件的配置 https://platform.xiaomimimo.com/docs/zh-CN/integration/claudecode 截图