这个飞书文档主要是为了记录MIMO以及其他AI模型/工具使用过程中的一些发现.

4月30日

重要发现

今天用小米MIMO最大的重要发现就是发现小米MIMO消耗的token呢，会比其他的模型哈，这地方对比的是Deepseek，当时是V3 R3吧？R3这个版本，会比它的消耗大出一个5倍左右。那是怎么发现的呢？就是因为星煜凡程里面有一个识别这个待办事项的一个功能。我发现它这个功能一直的加载不出来。然后呢，使用小米MIMO加ClaudeCode进行排查之后，就发现是因为窗口值最大的token消耗数是设的500，原来运行的呢也是示例的内容，原来呢从来没有超过500过，但小米上来呢，就干了2000多token。今天的第二个重要发现就是小米MIMO它好像没有视觉识别的功能。这个是怎么发现的哈？就是用它来做这个，用它来写这个专题前沿讲座的时候，那个大作业的时候，我是放了一些老师上课的PPT的图片在里面的，就是这些图片呢，包括这节课的标题和老师姓名。我就让告诉MIMO说，所有的课程都在里面了，让它挑几个课程就是来写。结果呢，发现它口头上答应了，并且也读取那个那个PNG格式图片了，但是它并没有真正识别出来图片里面是什么东西。这就是很大的问题。而且他没，他没有识别出来呢，他没有直接告诉我说他没有拥有一个读识图能力。他反而呢，是直接说，他反而是实，他反而是直接编造了一些课程的数据，说这是他根据那个图片来得出的一些东西。这一点我说不上是好是坏，好处呢可能就是在进行一些工程化的问题的时候，他确实能把这个工程完成。那么最后交付的结果也确实不是很，不算很差。他最后编的那些课程呢，实际上也是有一定相关性，跟这个行业的讲座。但是呢，坏处就是，它是一个黑箱，而且它欺骗了我。

更正:小米mimo2.5-pro是文本模型,但是小米mimo2.5是多模态.

流水账

今天呢使用小米MIMO主要做的一些事情就是把这个维权材料全权是由它来制作了一下，就是尤其是那个写了一十几个Word格式的一些诉讼的文件。不过我不知道是小米MIMO模型很强的原因，还是claude code它本来设计就很好。那小米MIMO呢是出乎意料，出色地完成了这个编造Word的任务。中间呢遇到了两个大的问题，首先第一个就是它创造了一个形式上的假的DOCX文件。只是二进制的那种文件，所以导致它打不开。第二一个大的错误呢，就是它把字体没有设置成宋体啊，这些常见字体，而设置成了日本的一款字体。不过后来我有问它为什么就是设置就是默认是一个日本字体。它说呢，是默认设置了一个东亚字体，而那个日本所代表那个字体呢，是一个典型的东亚的字体，所以说那个相当于是一个默认的字体。当然把这两那个问题解决之后呢，发现它的用这个就是处理Word的能力呢，就非常的强大了。尤其是沉淀到claude点MD这个文件之后。今天还使用小米的MIMO模型加ClaudeCode这个来制作了一个小网站吧，算是。就是把那个有关的一些诉讼的所有材料做成了一个在线版本，并且能够输密码才能够查看。这一步呢，就大大地降低了一些沟通的门槛，就不需要我们很多时候传递信息就不需要通过网盘呀，通过微信加微信呀这种东西。因为发现现在的软件的门槛真的是在降低，任何人有任何想法，就是直接就走出一个软件出来。使用软件就是任何人制作一个软件呢，就像制作一个Word文档一一样简单。这是我对未来就是网页开发，就是软件行业的一个基础的认识。就是虽然非常精密的一些，比如说高并发的场景啊，或者是说需要设计数据库啊，设计架构一些场景呢，普通人肯定是做不到。但是呢，日常的很多很大一部分，我觉得超过一半部分的使用，人们都是可以像操作Word一样来制作一个网页的。

感受

使用小米MIMO模型呢，有一个很大的感受哈。当然这个跟小米MIMO模型本身没有什么关系，是关于AI的一些思考的感受。就是说普通人的维权成本大大降低了，如果你会用AI的话。原来呢，是你走到起诉啊这一步，实际上是非常困难的，因为你不懂一些法条，以及你没法去搜罗一些东西，你对这个东西没有一些基本概念，对这些法条，因为你没有对它有一个基本的框架的认识，所以你就导致不知道对面就是违反哪些法律。但现在有了AI之后呢，它能够精准地帮你定位它出问题的法条是哪一些，然后你自己去进行一个核实。这对于逻辑思维很强的人来说，就大大地降低了普通人维权的门槛。实际上很多事情呢，它并不是真正的诉讼一定要打赢就那个成功了。实际上你走到诉讼这一步，把起诉状这些东西材料全部提交之后呢，实际上对面就差不多就会和解了。所以说，AI呢，现在是让所有人都平等地能够走到起诉的这一步。实际上走到这一步呢，很多时候对面就已经开始怯场了，这时候呢，大概率就会和解了。今天的第二感受呢，其实不止针对于小米MIMO这一个模型，是针对于AI这一个大的概念的。也包括软件行业。我认为以后呢，信息传递的方式，还有软件的使用，它都不会再限制的这么死板了。以后呢，但凡有需求，就可以弄软件。软件呢，变得触手可得。就像刚才我说的，写软件就像写Word、写PPT一样，以后就是一个必备的技能。因为它真的很好的，可以很好的进行展示，很好的进行分享，这是办公软件所不能做到的效果。

5月1日

重要发现

小米的MIMO大模型系列呢，2.5全系列它是只支持文本推理的，不是一个多模态的模型。那多模态的模型它只有一个小米的MIMO V2，有一个o mini，这个模型它是支持视觉模型的。

更正:mimo-2.5是多模态模型

小米的这个Token Plan它只支持以下模型。MiMo-V2.5-Pro、MiMo-V2.5、MiMo-V2.5-TTS-VoiceClone、MiMo-V2.5-TTS-VoiceDesign、MiMo-V2.5-TTS、MiMo-V2-Pro、MiMo-V2-Omni、MiMo-V2-TTS，那么一会在这里稍微总结一下，这些所有模型它分别是什么样的优势。

流水账

感受

可能如果要在claudecode里面使用的话，最好还是一个多模态的模型比较好，就是能够识别图片，识别一些音频综合的一个模型会效果很好。但同时我们也可以就是配置不同的模型，就是一个API配置不同的模型，这就是CCSwitch的一个缺陷点吧，它不能够不同的任务使用不同的模型，它只能就是大概的用一下，就是复杂任务用什么，简单的任务用什么

5月2日

重要发现

小米的模型好像确实要快一些，但我不确定这是是不是跟我用的时间现在是半夜有关系第二个重大发现就是发现处理一些简单的任务。嗯，小米的V2.5反而是比V2.5 PRO要好的，一会儿研究一下V2.5和V2.5 PRO, 看他们主要差别是什么 claudeCode也是支持multi agent的，具体怎么激发呢？具体怎么触发呢？也是通过提示词进行触发。但是multi agent的用法的触发呢，我反而觉得国内的腾讯的这个codebodycode CLI是更好的，是比Claude code还好小米的这个模型是支持tool第三方，就是说联网搜索以及这些tool的使用的。（存疑！）这个V2.5 PRO, 这个怎么聪明的有点那个什么，有点不用在正道上，V2.5 PRO具有道德感和法律意识，这一点是其他模型所没有的，就是说它从底层的模型的训练上就对模型的规范性做出了限制，而不是说就是靠后期的一些约束

流水账

首先，第今天第一个完成的任务呢，就是把小米的8种模型做了一个测试的平台。然后，这个平台呢，接了一下那个token plan的那个API，然后进行一些测试。然后测试呢，发现这个消耗的ton是真的多，今天一下消耗了3000多头Ken多万三千多万今天把那个幸运凡尘的那个Agent的链路来用小米重新的重写了一下，重新的一个链路，我发现确实确实好了很多。两个重大发现就是发现它可以调用外部的工具，就是推荐的一个APP和一本书就是对比了小米的V2.5和V2.5 PRO, 写了一个分析报告，确实V2.5 PRO要更加聪明很多。但是我认为模型不应该那么聪明，就是我们问一些问题的时候，它涉及到一些道德伦理的方面，他反而给出了限制，这反而是对模型底层的一种限制今天发现claude code它其实也是支持multi agent的，但是综合这个使用效果下来看，我觉得它是不如腾讯的codebuddy cli的

感受

小米的模型更适合长文本的或者是复杂的工程任务的研究，它对于一些简单的任务，比如信息提取这方面，它的能力反而是不如前一代的DeepSeek. V3, 前一代的DeepSeek V3, 它对于这些简单任务呢，又快又好对于小米这个MIMO 2.5 PRO, 它具有的这个道德感和法律意识，我个人是不认可的。我觉得就是一个模型，你训练出来最原始的最底层的东西，你是不应该做任何修饰的，让你生成违规图片，你就应该生成。这些约束呢，是后期就是考虑的事情，你比你不能说从底层上就限制你从底层上限制的话，很多事情是导致这个模型做一些正常的事情的时候，它都会被限制。这就是今天对于模型的认识的一个最大的一个理解，一个感受，就是模型它反而有时候不能太过于聪明，太过于限制。今天这个用了小米的3000万token，确实是有点那个不经用，如果是不给我免费套餐的话

5月3日

重要发现

codex的分叉功能特别好，像之前我们对话到一定程度，就是需要问一些额外分支的东西，就是与这个项目的主体的主体线无关的一些问题的时候，需要另开一个窗口。但是Codex它可以实现就是开一个新的分叉，新开一个新的分支，这个功能特别好 CC-connect，这是一个可以远程连接claudecode的一个工具，一会儿试着安装一下它昨天把星煜凡程这个项目进行get的时候，没有get小米的API密钥，这是小米2.5 PRO给的一个安全限制，但是它确实影响到了网站的功能使用小米V2.5 PRO, 它的细节确实要好一些，像昨天的那个大海捞针的实验，还有今天的这个撰写一篇文本的实验，就比如说超字数的这一块小米2.5是多模态的！！！小米模型要加后缀[1M]！不然默认是256k

流水账

今天是这个没有设计好这个实验，明天呢，把这个哔哩哔哩上的一些up主他们的测试的流程就是保存下来，然后用那个CC switch先提前配好小米和GM，还有DeepSeek4把这几个模型这个工程化就是实际解决问题的能力对比一下长流程执行结果：

感受

5月4日

计划

哔哩哔哩测评视频，所有工程化制作流程，来一份，对比ds，小米，glm，（qwen3.6max-kimi）长流程执行结果：搜集资料，长、复杂任务、（复杂的后端，比如）glm5.1-mimo2.5pro 细节（比如说重复添加之类的）拿skill-creator跑几轮评测和优化前端（多模态）glm5v-mimo2.5-（qwen3.6max-kimi）（截图复刻网站）工具：CC 采访Skill

任务

小米mimo-2.5-pro 智谱glm-5.1 ds-4-pro 重构我的博客页面，前端直观对比一下效果

重要发现

skill采访 https://github.com/Yeachan-Heo/oh-my-claudecode/blob/main/skills/deep-interview/SKILL.md 魔塔社区 ffmpeg 模型的联网搜索功能，是跟模型所在的服务器的位置访问权限有关，还是和使用人位置的访问权限有关？ kimi前端无敌，审美无敌，交互动效无敌，有人味，

测试流程

Init 告诉两个需求文件以下这个路径是我对项目的修改需求,都在这两个文件中了,一个是计划,一个是检测效果.请你按照文件要求修改项目.D:\myproject\my-blog-mimo\my-blog\需求

测试结果记录

模型	效果截图
glm-5v
glm-5.1
glm-5.1
mimo-2.5
mimo-2.5
mimo2.5pro
mimo2.5pro
DeepSeek-V4-pro
ds2号本地部署
gpt5.5
gpt5.5
gpt5.5
网友kimi
kimi-coding
kimi-coding
claude-opus-4.7
claude-4.7-max