大语言模型推理思维链CoT升级版,推理草稿链,Chain of Draft,aka CoD啊!我们试过高级prompting或者用过deepseek r1和Gpt o3都知道,里面用的就是推理思维链。你问他就算一个很简单的问题,它都会做一大堆的思考,速度和tokens的消耗确实令人堪忧!最新一篇海外著名视频会议大厂Zoom论文出来,提出CoD的prompting技术,让大语言模型输出的质量接近CoT,但是速度飞快…
Claude3.7 + Trae:最强AI编程组合?
Claude 3.7 Sonnet免费用啊!我昨天分享了个视频对全球首个混合推理模型Claude 3.7进行了测评,同一套测试用例打败了DeepSeek r1。可惜官网的免费额度有限。今天我们看一个可以完全免费用的方法,那就是字节的Trae这个AI编程IDE了…
DiffusionLLM测评:真能打败自回归模型吗?
上个视频我们聊了Diffusion LLM以及它的倡导者Mercury Coder大语言模型,了解了它和传统自回归大语言模型如DeepSeek等的异同。承诺会去测试下这个特别的模型。 好,那就来吧,我们去到官网…
Mercury Coder:自回归大语言模型终结者?
第一个Diffusion LLM 大语言模型啊,号称闪电级别的生成速度啊!今天淘到个inceptionlabs出品很有意思的大模型交错Mercury的,它提供playground给我们免费用,这里最有意思的事它和我们常见的LLM不一样,他是个diffusion LLM,什么意思呢,我们知道生成图片的Diffusion Model,你给他一个prompt,它会先从一个满是噪音的图片,然后一步步去降噪,直到出来一张清晰的图片。而diffusion LLM类似,你给他一个prompt…
QwQ Max:阿里开源推理模型追平DeepSeek R1
阿里QwQ Max开源模型追平DeepSeek r1啊!阿里通义最新发布了推理模型QwQ-Max-Preview预览模型。废话不多说,立刻去Demo,来到qwenlm,默认基座模型选中Qwen2.5-Max,然后下面这里开启QwQ深度思考…
Gemini Code Assist:谷歌免费硬扛Cursor!
谷歌推出完全免费的Gemini Code Assist来抢占AI编程市场啊,背后用到的是专门针对编程微调优化过的Gemini 2.0大语言模型。我们知道像cursor等AI编程工具免费版的功能是很有限的,一般一个月提供不超过2000次的代码自动补全,而谷歌为了抢占市场,直接提供18万次,这已经和免费没有什么区别了。废话不多说,赶紧去demo下…
Grok3:零代码开发酷炫游戏
零代码开发酷炫游戏啊!刚海外网站闲逛时发现很多海外网友用Gork3零代码写出各种酷炫的游戏,这里想跟大家分享几个。首先,我们看下levelsio分享这个,他说他没有游戏开发经验,然后用cursor直接自然语言对话,耗时三个小时做了这个打飞机游戏。我们看下效果…
Claude 3.7测评报告:这次真打败了DeepSeek!
最新Claude 3.7出炉,这是第一个作对所有题的大语言模型,已经打败了DeepSeek r1和 Grok 3 推理模型…
Claude Code:最强大语言模型AI编程工具
claude code横空出世啊!上一集视频评测了最新的claude 3.7,这是第一个做对了我所有测评用的题的大模型,所以我封它为最强大语言模型。除了claude 3.7, claude这次还推出了一个claude code,这是一个基于命令行的AI编程工具,如果大家记得我之前给大家分享的aider的话,它们基本就是同一类型的玩意儿。不过目前它还是处于waitlist阶段…
AIEase: 免费AI图片生成和编辑全家桶
100%免费AI生成和编辑图片,这可能是我见到过的最全的免费AI工具图片工具了, 一般的AI生成图片,艺术照,头像,卡通都不在话下,换脸,换发型,换衣服,换任何对象等等等等…