视频字幕提取工具我们见得多了,但是能提取多个人物的对话,并识别出这些人物,以及这些人物说话的时间点,这种AI工具就凤毛麟角了,更何况是完全免费。有了这种工具,我们就可以实现很多其他AI工具了,比如可以实现自动将长视频编辑成高光短视频等,大家觉得还能做成什么其他工具呢?
- 访问入口)
视频字幕提取工具我们见得多了,但是能提取多个人物的对话,并识别出这些人物,以及这些人物说话的时间点,这种AI工具就凤毛麟角了,更何况是完全免费。有了这种工具,我们就可以实现很多其他AI工具了,比如可以实现自动将长视频编辑成高光短视频等,大家觉得还能做成什么其他工具呢?
OpenAI推出AI变成功能啊!快速分享个消息,OpenAI在它的Desktop APP上推出了AI编程功能!现在只要我们桌面上打开vscode等AI编程工具,当你在浏览一个代码文件的时候,你切换到ChatGPT,它就会识别到你在浏览的这个代码文件,然后你就能叫他帮你修改代码了…
我们有玩过Stable DIffusionffusion的应该对这个不陌生,比如通过OpenPose可以控制我们生成图片人物的姿态。那么ControlNet究竟是怎么工作的呢?首先,我们得知道Stable Diffusion本身的工作方式就是…
免费搭建Agent工作流用deepseek生成精美图片啊。今天闲来无事玩了下字节跳动的coze,AKA扣子了,我之前也没有玩过,上面功能挺多的,我就简完了下Agent,觉得挺有意思的。废话不多说,我们demo看下,来到扣子…
语音版photoshop啊!今天快速分享个YC孵化的项目,叫做awe ai,通过它你只需要说话就能像photosop一样编辑图片,甚至生成动画,但是要加入waitlist,输入个自己邮箱就好了。好,我们快速看下demo…
这可能是最简单的用自己数据微调出自己的DeepSeek r1的方法了。今天淘到的这个AI工具叫做lightning ai,它让我们只需要简单几步就能微调出自己的DeepSeek r1. 而它每月提供免费的GPU额度给我们用,足够我们一般人玩耍了。废话不多说,我们立刻看Demo…
阿里最新QwQ-32B推理模型测评报告啊,最终结果是否能打败DeepSeek r1呢?废话不多说,直接开测,先先选择好QwQ-32B模型,下面深度思考也确认打开…
免费DeepSeek文生图啊!我们知道DeepSeek本身不是一个多模态模型,也就是说模型本身是不支持图片等的输入和输出的。这么好的一个文本生成模型不能直接生成图片,着实有点可惜。但是也不是不可为,这里跟大家说个技巧,通过直接交deepseek生成一个文生图的提示词,然后叫它填写到一个可以url中,我们就可以生成图片了,这样我们就能结合deepseek强大的文本能力以及第三方免费的文生图能力了。 这里的url其实就是第三方的一个文生图服务,叫做pollination的免费AI工具,我们只需要在它提供url,事实上就是一个http的api,url上提供文生图提示词就能能生成图片了…
免费训练自己的语音和图片模型啊。今天快速分享一个刚淘到的一个叫做weights的AI工具,在上面我们可以免费使用各种lora创建图像和视频,还可以快速的训练自己的语音和图像模型,比如可以用刘德华的声音训练个刘德华的模型,然后用这个模型来生成刘德华唱张学友的歌等…