2024-11-24 |
支付宝发布 EchoMimicV2 :从数字脸扩展到数字人 可以通过图片+音频生成半身动画视频 |
AI 项目 ‧ 小互 |
|
2024-11-24 |
OOTDiffusion:支持半身、全身的开源的高分辨率虚拟试穿模型 |
AI 工具 ‧ 小互 |
|
2024-11-23 |
MagicQuill:AI 驱动的图像编辑系统 只需在图像上画几笔即可轻松编辑图像 |
AI 教程 ‧ 小互 |
|
2024-11-23 |
Runway 推出视频扩展工具:Expand Video 可以无缝的为视频扩展画面 |
AI 教程 ‧ 小互 |
|
2024-11-21 |
GetPickle AI是一款革新虚拟会议的AI工具 让你的替身帮你开会 你去干别的 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-11-21 |
Comfyui_Object_Migration:一致性换衣模型和工作流 实物衣服 一键穿上 |
AI 教程 ‧ 小互 |
|
2024-11-20 |
ElevenLabs 推出构建语言对话AI代理的功能 可使用其语音模型接入AI模型 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-11-20 |
Stripe 推出 Stripe Agent Toolkit:让 AI 代理能自动进行支付 帮你购物、订机票等 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-11-19 |
Mistral AI 发布了全新的 Pixtral Large 开源模型 超越 GPT-4o、Gemini-1.5 Pro 和 Claude-3.5 Sonnet |
XiaoHu.AI日报 ‧ 小互 |
|
2024-11-19 |
Perplexity 推出全新 AI 驱动购物助手:Shop Like a Pro 支持搜索结果一键下单 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-11-19 |
Mistral AI推出了更新版的Le Chat 支持在聊天中进行搜索、上传 PDF、编程、图像生成等 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-11-19 |
阿里云推出 Qwen2.5-Turbo 专为处理长文本场景设计 支持 100 万 Token 的上下文 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-11-14 |
Context Autopilot:全球首个上下文引擎驱动的 AI 办公助手 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-11-14 |
苹果发布 Final Cut Pro 11 新增多项AI功能 自动抠图和自动生成字幕 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-11-14 |
Thinking-Claude:让 Claude 实现类似OpenAI o1 模型一样的高级推理模式 |
AI 教程 ‧ 小互 |
|
2024-11-14 |
OpenAI 官方发布: ChatGPT 学生写作指南 指导学生如何正确使用GPT |
XiaoHu.AI日报 ‧ 小互 |
|
2024-11-13 |
对标NotebookLM Play AI推出了PlayDialog:可生成自然对话播客、旁白以及自然交互 |
AI 工具 ‧ 小互 |
|
2024-11-13 |
Fashion-VDM:通过给定的服装图像和人物视频 生成一段虚拟试穿视频 |
AI 项目 ‧ 小互 |
|
2024-11-13 |
HeyGen 正在开放 API 你可以轻松创建数字人、进行视频翻译、部署交互式数字人 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-11-12 |
Google DeepMind宣布开源其能够预测蛋白质结构的AI模型 AlphaFold 3 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-11-12 |
字节跳动发布AI图像编辑工具:SeedEdit 无需专业图片处理技能 一句话即可实现P图 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-11-12 |
ChatGPT 帮我制定护肤方案 两个月让我的皮肤变成了这样… |
AI 教程 ‧ 小互 |
|
2024-11-10 |
NVIDIA 推出的 AI Blueprint:可以帮你观看数小时的视频并提供摘要总结和问答 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-11-10 |
Google 正式推出 Gemini AI 驱动的视频演示应用 Vids 通过简单提示即可生成视频演示 |
AI 工具 ‧ 小互 |
|
2024-11-09 |
Magentic-One:微软发布用于解决复杂任务通用多智能体 可自行编写和执行代码并进行人机交互 |
AI 项目 ‧ 小互 |
|
2024-11-08 |
苹果正式推出集成 Siri 和 Apple Intelligence新框架 Siri可以实时读取你屏幕信息并执行操作 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-11-07 |
X-Portrait 2:由字节跳动开发 可将任意视频角色的表情和动作转移到任意对象的技术 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-11-07 |
FLUX 1.1 Pro Ultra 发布 支持高达 4 兆像素的分辨率 每张图片仅需约 10 秒 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-11-06 |
ReadKidz:利用AI一键生成儿童绘本故事书和多媒体故事 可随心定制设定 |
AI 工具 ‧ 小互 |
|
2024-11-05 |
腾讯发布3D开源模型:混元-3D 10秒即可生成高分辨率细3D模型 |
AI 项目 ‧ 小互 |
|
2024-11-05 |
Hertz-dev:首个会话音频开源模型 全双工实时语音交互 120毫秒超低延迟 |
AI 项目 ‧ 小互 |
|
2024-11-05 |
腾讯发布目前最大开源MoE模型:腾讯混元大模型(Hunyuan-Large) 具有 3890 亿参数 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-11-05 |
Fish Audio 发布语音到语音模型Fish Agent V0.1 3B 实现“即时”语音克隆 |
AI 项目 ‧ 小互 |
|
2024-11-05 |
Rive 发布 Layouts 新功能 只需设计一次 图像动画自动适应屏幕大小和各种布局 |
AI 工具 ‧ 小互 |
|
2024-11-04 |
苹果发布 Ferret-UI 2 专门理解和与移动用户界面交互的模型 让手机成为通用UI助手 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-11-04 |
教程:使用 E2F5工具实现文本转语音和唇同步视频制作 |
AI 教程 ‧ 小互 |
|
2024-11-04 |
Runway Act-One 使用教程 :仅通过单个视频和任意角色图像生成生动的表演动画 |
AI 教程 ‧ 小互 |
|
2024-11-04 |
Recraft发布其最新图像生成模型:Recraft V3 可精确处理复杂长文本和手指等解剖学细节 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-11-03 |
In-Context LoRA:给图像生成模型增加“情节记忆力”和“角色一致性”的能力 |
AI 项目 ‧ 小互 |
|
2024-11-03 |
Claude 3.5 新功能 支持对 100 页的PDF 图像、图表和图形进行可视化分析 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-11-03 |
Meta FAIR发布人工多模态指尖 具有人类级别的触觉感知能力 增强机器人触觉感知 |
AI 项目 ‧ 小互 |
|
2024-11-03 |
π0:通用机器人策略模型 让机器人具备在人类环境中自主执行多种复杂任务的能力 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-11-01 |
D-ID推出了两款新数字人工具 只需一分钟视频训练即可生成 支持复杂表现 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-11-01 |
Wonder Dynamics 推出可将传统视频片段自动转换为 3D 动画场景新技术——Wonder Animation |
XiaoHu.AI日报 ‧ 小互 |
|
2024-11-01 |
Google Gemini API 新增“搜索锚定”功能 利用 Google 搜索实时数据确保准确性 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-11-01 |
OpenAI 高层 Reddit AMA 完整版 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-11-01 |
X-to-Voice:输入你的 Twitter 账号名称 自动生成能说话的个人资料头像 |
AI 工具 ‧ 小互 |
|
2024-10-31 |
Google DeepMind 公布其NotebookLM背后的创新音频生成技术 使 AI 能够生成更加自然的对话 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-10-28 |
Ultralight-Digital-Human :支持在移动设备上实时运行的超轻量级数字人模型 |
AI 工具 ‧ 小互 |
|
2024-10-28 |
NotebookLlama:Meta 发布了一个通过Llama从 PDF 文件生成播客的引导式教程 |
AI 教程 ‧ 小互 |
|
2024-10-27 |
PersonaTalk:字节跳动开发出可精准给视频进行AI配音的模型 能保持口型同步、说话风格完美匹配 |
AI 项目 ‧ 小互 |
|
2024-10-27 |
MaskGCT:零样本文本到语音(TTS)模型 支持跨语言配音、语音转换、情感控制等 |
AI 项目 ‧ 小互 |
|
2024-10-25 |
智谱 AI 这次是真的国际领先了 发布AutoGLM 一句话手机自动帮你点外卖、订酒店买东西 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-10-25 |
Cloudflare推出了一个新的开发工具:Workflows 大幅简化多步骤应用的构建 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-10-25 |
Google 更新 MusicFX DJ 可以像DJ一样灵活控制音乐生成和编辑 |
AI 工具 ‧ 小互 |
|
2024-10-24 |
Midjourney 大更新:新增外部图像编辑器、图像重纹理功能 编辑图像更轻松 |
XiaoHu.AI 学院 ‧ 小互 |
|
2024-10-23 |
ElevenLabs 推出全新AI语音生成工具 Voice Design 可通过文本提示创建个性化语音 |
AI 工具 ‧ 小互 |
|
2024-10-23 |
美国14岁少年与Character.AI 聊天机器产生了强烈的情感依附 开枪自杀身亡 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-10-23 |
Genmo 推出目前全球最大的开源视频生成模型 Mochi 1 具备100亿参数 |
AI 项目 ‧ 小互 |
|
2024-10-23 |
Ideogram发布 Canvas 无限创画布工具以及图像填充和扩充工具 轻松编辑图像 |
AI 工具 ‧ 小互 |
|
2024-10-23 |
Runway 推出一款生成式角色表演工具 可以把视频转换成任意风格虚拟角色动画 并且保持表情语音口型同步 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-10-23 |
Anthropic 发布Claude 3.5 Haiku 以及一项炸裂的新功能 AI可以模仿人类访问电脑 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-10-22 |
Omne:通过多智能体合作 解决AI长期记忆能力并提高AI推理能力 |
AI 论文 ‧ 小互 |
|
2024-10-22 |
微软发布了10个全新的自主AI代理 可以处理客户查询的“人工智能员工” |
XiaoHu.AI日报 ‧ 小互 |
|
2024-10-22 |
微软CEO Satya Nadella :计算能力现在每 6 个月翻一番 微软正在使用 AI 构建 AI |
XiaoHu.AI日报 ‧ 小互 |
|
2024-10-21 |
Project Turntable:将2D矢量图像 像3D对象一样进行旋转 并自动补充缺失部分 |
AI 工具 ‧ 小互 |
|
2024-10-21 |
Applicant AI:人工智能面试系统 通过AI视频聊天快速筛选求职简历 |
AI 工具 ‧ 小互 |
|
2024-10-19 |
Meta发布 Meta Spirit LM 一个可以在语音和文本之间进行无缝转换的多模态语音模型 |
AI 资源 ‧ 小互 |
|
2024-10-19 |
Claude Financial Data Analyst :由 Claude 支持的可视化金融数据分析工具 |
AI 工具 ‧ 小互 |
|
2024-10-19 |
Newton AI 模型:通过输入传感器数据 模型可以分析数据自行发现物理规律 |
AI 论文 ‧ 小互 |
|
2024-10-18 |
Mistral 发布针对笔记本电脑和手机优化的最新 AI 模型 性能优于Llama 和 Gemma 模型 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-10-18 |
Zerox :一个简单易用的GPT OCR 工具 可将 PDF、DOCX 等文件转换为 Markdown 格式 |
AI 工具 ‧ 小互 |
|
2024-10-18 |
全球首创桌面双轮足式 AI 机器人 接入ChatGPT 能跑、能看、能说、倒不了… |
XiaoHu.AI日报 ‧ 小互 |
|
2024-10-18 |
Perplexity AI 推出了两个全新功能:内部知识搜索 和 Spaces 更加方便易用 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-10-18 |
Google NotebookLM 推出企业版和个性化控制 你可以自定义AI播客内容 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-10-18 |
Hallo 2:根据单张图像和音频输入能够生成长达一小时的4K分辨率人像视频 |
AI 项目 ‧ 小互 |
|
2024-10-18 |
AMT-APC:自动生成钢琴伴奏模型 将任意音乐转换成与原曲匹配钢琴伴奏 |
AI 项目 ‧ 小互 |
|
2024-10-17 |
Eye Contact:目光矫正 API 自动调整视频、直播中眼睛的视线方向 |
AI 工具 ‧ 小互 |
|
2024-10-16 |
Power-over-Skin “皮肤供电”技术 让可穿戴设备无需电池也能工作 |
AI 论文 ‧ 小互 |
|
2024-10-16 |
阿里巴巴推出升级版AI翻译工具:Marco MT 性能超越Google、DeepL和ChatGPT |
XiaoHu.AI日报 ‧ 小互 |
|
2024-10-15 |
Augmented Physics:增强现实你的物理课本 让你的物理课本上的图表动起来 |
AI 论文 ‧ 小互 |
|
2024-10-15 |
Adobe Premiere Pro 推出多项新的生成式AI功能 大幅提高视频编辑效率 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-10-14 |
@MKBHD :如何在 54 分 19 秒 20 毫秒内制作高质量油管视频 |
AI 教程 ‧ 小互 |
|
2024-10-14 |
One-Click Creative Template:创意模型 用一张卡通图片总结4张真实人物照片 |
AI 资源 ‧ 小互 |
|
2024-10-14 |
F5-TTS :支持多语言切换、速度控制、情感表达 具有零样本生成能力的TTS系统 |
AI 项目 ‧ 小互 |
|
2024-10-12 |
Anthropic CEO :5到10年内 AI将助力人类扫除几乎所有疾病 人类寿命有望翻倍达到150岁 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-10-12 |
OpenAI 开源多智能体设计和管理工具OpenAI Swarm 可让多个智能体协同工作 |
AI 项目 ‧ 小互 |
|
2024-10-11 |
特斯拉We Robot 发布会全纪录:完全无人驾驶出租车、Optimus 机器人、Robovan(机器人巴士) |
XiaoHu.AI日报 ‧ 小互 |
|
2024-10-09 |
Inworld AI 发布《Beyond 2024》 展示未来人工智能游戏开发组件系统 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-10-09 |
Anthropic 推出的 Message Batches API 可以批量处理大量请求 价格便宜50% |
XiaoHu.AI日报 ‧ 小互 |
|
2024-10-09 |
Podcastfy:将任何网页、PDF和文本内容自动生成播客音频内容 |
AI 工具 ‧ 小互 |
|
2024-10-08 |
PMRF:一种新的图像恢复算法 高质量修复图像 降低图像失真还原跟自然逼真度 |
AI 项目 ‧ 小互 |
|
2024-10-08 |
TxT360:一个用于大语言模型训练的全球去重的高质量数据集 5.7万亿个高质量的tokens |
AI 资源 ‧ 小互 |
|
2024-10-07 |
使用 YOLOv 11 模型实现实时手语检测 可同时识别多个手语手势 |
AI 项目 ‧ 小互 |
|
2024-10-07 |
Ebook2Audiobook:将电子书自动转换为有声书 支持语音克隆、多种语言 |
AI 工具 ‧ 小互 |
|
2024-10-07 |
采访当今最伟大的数学家对AI的看法 陶哲轩:我们正踏入数学的全新领域 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-10-07 |
Voice-Pro:支持超过 100 种语言、400 多种声音的语音视频转录、翻译工具 |
AI 工具 ‧ 小互 |
|
2024-10-07 |
人工智能能否读取你的思想? |
XiaoHu.AI日报 ‧ 小互 |
|
2024-10-06 |
PimEyes :人脸识别搜索引擎和反向图像搜索工具 上传照片帮你追踪照片上的人 |
AI 工具 ‧ 小互 |
|
2024-10-05 |
Bolt․new:AI 帮你自动写代码 自动运行并自动部署 而且全部在浏览器中完成 |
AI 工具 ‧ 小互 |
|