结构之法 算法之道
订阅

最新

1. NaVILA——可语音交互的用于四足和人形导航与避障的VLA模型:在VLM的导航规划下,执行基于视觉的运动策略(含NaVILA和rsl_rl的源码解析) v_JULY_v
2. 3D版的VLA:从3D VLA、SpatialVLA到PointVLA——3D点云版的DexVLA,在动作专家中加入3D数据 v_JULY_v
3. 从宇树摇操avp_teleoperate到unitree_IL_lerobot:如何基于宇树人形进行二次开发 v_JULY_v
4. Open-TeleVision源码解析——宇树摇操方案的重要参考:VR控制人形机器人采集数据 v_JULY_v
5. Hi Robot——大脑加强版的π0:基于「VLM的高层次推理+ VLA低层次任务执行」的复杂指令跟随及交互式反馈 v_JULY_v
6. OpenVLA-OFT——微调VLA时加快推理的三大关键设计:支持动作分块的并行解码、连续动作表示以及L1回归(含输入灵活化及对指令遵循的加强) v_JULY_v
7. Fourier-Lerobot——把斯坦福人形动作策略iDP3封装进了Lerobot(含我司七月的idp3落地实践) v_JULY_v
8. GR00T N1——英伟达开源的通用人形VLA:类似Helix的快与慢双系统,且可类似ViLLA利用海量的无标注视频做训练 v_JULY_v
9. LeRobot源码剖析——对机器人各个动作策略的统一封装:包含ALOHA ACT、Diffusion Policy、VLA模型π0 v_JULY_v
10. ViLLA——继AgiBot World之后,智元发布GO1及其背后基于潜在动作的VLA架构ViLLA:利用海量的无标注视频做训练(含LAPA、Moto的详解) v_JULY_v
11. 对通用VLA π0的微调——如何基于各种开源数据集、以及私有数据集微调π0(含我司七月的微调实践及在机械臂上的部署) v_JULY_v
12. π0源码剖析——从π0模型架构的实现(如何基于PaLI-Gemma和扩散策略去噪生成动作),到基于C/S架构下的模型训练与部署 v_JULY_v
13. Helix——Figure 02发布的通用人形机器人控制VLA:不用微调即可做多个任务的快与慢双系统,让两个机器人协作干活(含清华HiRT详解) v_JULY_v
14. R1-Zero与R1的复现之路——从Open-Reasoner-Zero到Open R1:先后涉及规则奖励下的PPO迭代,及SFT+GRPO的复现 v_JULY_v
15. MTP——我对DeepSeek V3中多token预测MTP的代码实现(含对V3官方MoE、MLA推理代码的解读) v_JULY_v
16. 一文通透Qwen多模态大模型:从Qwen-VL、Qwen2-VL到Qwen2.5-VL(含我司提问VLM项目的实现思路) v_JULY_v
17. MLA实现及其推理上的十倍提速——逐行解读DeepSeek V2中多头潜在注意力MLA的源码(图、公式、代码逐一对应) v_JULY_v
18. π0开源了且推出自回归版π0-FAST——打造高效Tokenizer:比扩散π0的训练速度快5倍但效果相当(含π0-FAST源码剖析) v_JULY_v
19. 一文速览DeepSeek-R1的本地部署——可联网、可实现本地知识库问答:包括671B满血版和各个蒸馏版的部署(含单卡4090部署671B) v_JULY_v
20. 斯坦福UMI代码解析:刷盘机器人Universal Manipulation Interface代码的整体解读 v_JULY_v
更新于 15 分钟前

近期历史最近 100 条记录

2025-02-01 一次性总结数十个具身模型(2024-2025):从训练数据、动作预测、训练方法到Robotics VLM、VLA(如π0等) v_JULY_v
2025-01-31 一文速览DeepSeekMoE:从Mixtral 8x7B到DeepSeekMoE(含MoE架构的实现及DS LLM的简介) v_JULY_v
2025-01-27 一文通透让Meta恐慌的DeepSeek-V3:在MoE、GRPO、MLA基础上提出Multi-Token预测(含FP8训练详解) v_JULY_v
2025-01-27 RoboVLM——通用机器人策略的VLA设计哲学:如何选择骨干网络、如何构建VLA架构、何时添加跨本体数据 v_JULY_v
2025-01-25 iDP3的人形遥操代码分析:从数据收集、数据转换到VR安装、人形机器人遥控 v_JULY_v
2025-01-22 一文速览推理模型DeepSeek R1:如何通过纯RL训练以比肩甚至超越OpenAI o1(含Kimi K1.5、QwQ-32B的解读) v_JULY_v
2025-01-20 iDP3的训练与部署代码解析:从数据可视化vis_dataset.py、训练脚本train.py到部署脚本deploy.py v_JULY_v
2025-01-16 iDP3的Learning代码解析:逐步分解iDP3的数据集、模型、动作预测策略代码(包含2D和3D两个版本) v_JULY_v
2025-01-12 一文速览CogACT及其源码剖析:把OpenVLA的离散化动作预测换成DiT,逼近π0(含DiT的实现) v_JULY_v
2025-01-11 一文通透OpenVLA及其源码剖析——基于Prismatic VLM(SigLIP、DinoV2、Llama 2)及离散化动作预测 v_JULY_v
2024-12-31 GRAPE——RLAIF微调VLA模型:通过偏好对齐提升机器人策略的泛化能力 v_JULY_v
2024-12-29 Diffusion Transformer(DiT)——将扩散过程中的U-Net换成ViT:近频繁用于视频生成与机器人动作预测(含清华PAD详解) v_JULY_v
2024-12-24 YAY Robot——斯坦福和UC伯克利开源的:人类直接口头喊话从而实时纠正机器人行为(含FiLM详解) v_JULY_v
2024-12-22 从DINO、Grounding Dino到DINOv2、DINO-X——自监督视觉Transformer的升级改进之路(基于ViT) v_JULY_v
2024-12-08 一文速览mamba的各种变体与改进:从MoE-Mamba、Vision Mamba、VMamba、Jamba到Falcon Mamba v_JULY_v
2024-12-04 一文通透vLLM与其核心技术PagedAttention:减少KV Cache碎片、提高GPU显存利用率(推理加速利器) v_JULY_v
2024-12-02 从Octo与TinyVLA、DeeR-VLA、3D-VLA——OpenVLA之外的VLA模型的持续升级 v_JULY_v
2024-11-26 斯坦福泡茶机器人DexCap源码解析:涵盖收集数据、处理数据、模型训练三大阶段 v_JULY_v
2024-11-26 Diffusion Policy——斯坦福UMI所用的动作预测算法:基于扩散模型的扩散策略(从原理到其编码实现) v_JULY_v
2024-11-26 英伟达HOVER——用于人形机器人的多功能全身控制器:整合不同的控制模式且实现彼此之间的无缝切换 v_JULY_v
2024-11-26 多模态PaliGemma 2(含1代):Google推出的基于SigLIP和Gemma 2的视觉语言模型(附SigLIP详解) v_JULY_v
2024-11-26 π0——用于通用机器人控制的VLA模型:一套框架控制7种机械臂(基于PaliGemma和流匹配的3B模型) v_JULY_v
2024-11-26 RDT——清华开源的双臂机器人“扩散动作大模型”(基于DiT改造而成):先预训练后微调,支持语言、图像、动作多种输入 v_JULY_v
2024-11-26 字节GR2——在大规模视频数据集上预训练且机器人数据上微调,随后预测动作轨迹和视频(含GR1详解) v_JULY_v
2024-11-26 UC伯克利HIL-SERL——结合视觉和人类示教与纠正的RL方法(直接真实环境中RL开训,可组装电脑主板和插拔USB) v_JULY_v
2024-11-26 机器人领域中的scaling law:清华高阳团队通过复现斯坦福UMI——探讨数据规模化定律(含UMI的复现关键) v_JULY_v
2024-11-26 斯坦福iDP3——改进3D扩散策略以赋能人形机器人的训练:不再依赖相机校准和点云分割(含DP3的详解) v_JULY_v
2024-11-26 基于人类视频的模仿学习与VLM推理规划:从DexMV、MimicPlay、SeeDo到人形OKAMI、Harmon(含R3M的详解) v_JULY_v
2024-11-26 一文通透OpenAI o1:从CoT、Quiet-STaR、Self-Correct、Self-play RL、MCTS等技术细节到工程复现 v_JULY_v
2024-10-12 从MDM、RobotMDM到UC San Diego的Exbody(含Exbody 2)——人体运动扩散模型:赋能机器人的训练 v_JULY_v
2024-10-10 H2O与OmniH2O——全身远程操作且RL训练的人形机器人(含师生学习与策略蒸馏详解) v_JULY_v
2024-10-08 VLM驱动机器狗——从UMI on Legs到Helpful DoggyBot:分别把机械臂装到机器狗背上、夹爪装到机器狗嘴里 v_JULY_v
2024-10-01 Fast-UMI——改进斯坦福UMI的硬件:用RealSense T265替代SLAM且实现机械臂的迁移与平替 v_JULY_v
2024-09-19 ReKep——李飞飞团队提出的让机器人具备空间智能:基于VLM模型GPT-4o和关系关键点约束(含源码解析) v_JULY_v
2024-08-26 一文通透DeepSeek-V2(改造Transformer的中文模型):详解MoE、GRPO、MLA v_JULY_v
2024-08-16 让AI写论文——全流程全自动的AI科学家:基于大模型提炼idea、写代码、做实验且最终写成论文 v_JULY_v
2024-08-12 2024自动驾驶(多模态)大模型综述:从DriveGPT4、DriveMLM到DriveLM、DriveVLM v_JULY_v
2024-08-09 微调LLama 3.1——七月论文审稿GPT第5.5版:拿早期paper-review数据集微调LLama 3.1 v_JULY_v
2024-07-28 SRT——基于模仿学习的手术机器人:来自约翰霍普金斯大学和斯坦福ALOHA团队 v_JULY_v
2024-07-24 一文速览Llama 3.1——对其92页paper的全面细致解读:涵盖语言、视觉、语音的架构、原理 v_JULY_v
2024-07-22 一文通透TTT:让RNN的隐藏层变成可学习的函数——继mamba之后也想超越Transformer v_JULY_v
2024-07-12 UC San Diego的三大机器人:AnyTeleop、Open-TeleVision、Bunny-VisionPro——从RGB相机到VR远程控制机器人 v_JULY_v
2024-07-03 一文通透mamba2「力证Transformer are SSM」:从SSM、半可分矩阵、SMA、SSD到mamba2 v_JULY_v
2024-06-29 一文速览Gemma及其微调(第5.2版):通过我司七月的早期paper-7方面review数据集微调Gemma2 v_JULY_v
2024-06-24 微调LLama 3——七月论文审稿GPT第5版:拿早期paper-7方面review数据集微调LLama 3 v_JULY_v
2024-06-23 康奈尔大学之论文审稿模型Reviewer2及我司七月对其的实现(含PeerRead) v_JULY_v
2024-06-22 人体姿态估计WHAM与手势估计HaMeR——人形机器人重定位的关键技术之一 v_JULY_v
2024-06-19 HumanPlus(斯坦福人形机器人)的代码解读与复现关键:从HST到HIT、HardWare v_JULY_v
2024-06-16 HumanPlus——斯坦福ALOHA团队开源的人形机器人:融合影子学习技术、RL、模仿学习 v_JULY_v
2024-06-15 LeRobot——Hugging Face打造的机器人领域的Transformer架构 v_JULY_v
2024-06-03 DexCap——斯坦福李飞飞团队泡茶机器人:更好数据收集系统的原理解析、源码剖析 v_JULY_v
2024-05-23 一文通透想取代MLP的KAN:通俗理解Kolmogorov-Arnold定理和KAN的方方面面 v_JULY_v
2024-05-07 基于大模型的idea提炼与创意生成:从让chatgpt直接生成创意到围绕论文和引用提炼idea之ResearchAgent v_JULY_v
2024-04-19 一文速览Llama 3:从Llama 3的模型架构到如何把长度扩展到100万——基于NTK-aware插值 v_JULY_v
2024-04-19 七月论文审稿GPT第4.2版:通过15K条paper-review数据微调Llama2 70B(含各种坑) v_JULY_v
2024-04-13 从零实现本地知识库问答——详解基于OCR和文本解析器的新一代RAG引擎:RAGFlow(含源码剖析) v_JULY_v
2024-04-12 提升大模型数据质量的三大要素:找到早期paper且基于GPT摘要出来7方面review——七月论文审稿GPT第4.5/4.6/4.8版 v_JULY_v
2024-04-05 Google视觉机器人超级汇总:从RT、RT-2到AutoRT/SARA-RT/RT-Trajectory、RT-H v_JULY_v
2024-03-28 七月论文审稿GPT第4版:通过paper-review数据集微调Mixtral-8x7b,对GPT4胜率超过80% v_JULY_v
2023-08-24 大模型并行训练指南:通俗理解Megatron-DeepSpeed之模型并行与数据并行 v_JULY_v
2023-08-12 学术论文GPT的源码解读与微调:从ChatPaper到七月论文审稿GPT第1版 v_JULY_v
2023-08-05 LLM高效参数微调方法:从Prefix Tuning、Prompt Tuning、P-Tuning V1/V2到LoRA、QLoRA(含对模型量化的解释) v_JULY_v
2023-07-05 baichuan7B/13B的原理与微调:从baichuan的SFT实现到baichuan2的RLHF实现 v_JULY_v
2023-07-05 基于LangChain+LLM的本地知识库问答:从企业单文档问答到批量文档问答 v_JULY_v
2023-07-05 医疗金融法律大模型:从ChatDoctor到BloombergGPT/FinGPT/FinBERT、ChatLaw/LawGPT_zh v_JULY_v
2023-07-02 图像分割的大变革:从SAM(分割一切)到FastSAM、MobileSAM v_JULY_v
2023-06-22 AI绘画与多模态原理解析:从CLIP到DALLE1/2、DALLE 3、Stable Diffusion、SDXL Turbo v_JULY_v
2023-04-30 AI绘画能力的起源:从VAE、扩散模型DDPM、DETR到ViT/Swin transformer v_JULY_v
2023-04-12 从零实现Transformer的简易版与强大版:从300多行到3000多行 v_JULY_v
2023-04-06 详解带RLHF的类ChatGPT:从TRL、ChatLLaMA到ColossalChat、DSC v_JULY_v
2023-03-31 ChatGLM两代的部署/微调/实现:从基座GLM、ChatGLM的LoRA/P-Tuning微调、6B源码解读到ChatGLM2的微调与实现 v_JULY_v
2023-03-22 LLaMA的解读与其微调:Alpaca-LoRA/Vicuna/BELLE/中文LLaMA/姜子牙/LLaMA 2 v_JULY_v
2023-03-14 LLM/ChatGPT与多模态必读论文150篇(已更至第101篇) v_JULY_v
2023-02-10 强化学习极简入门:通俗理解MDP、DP MC TC和Q学习、策略梯度、PPO v_JULY_v
2023-01-15 ChatGPT技术原理解析:从RL之PPO算法、RLHF到GPT4、instructGPT v_JULY_v
2022-10-23 Transformer通俗笔记:从Word2Vec、Seq2Seq逐步理解到GPT、BERT v_JULY_v
2022-10-11 22下半年:来长沙建第二支团队与所读的33本书(含哲学政法经济书单/笔记) v_JULY_v
2022-05-29 20 21九死一生、22上半年读20本书(含15本管理书单/笔记):继续百年征程 v_JULY_v
2021-09-17 通俗理解卡尔曼滤波(无人驾驶感知融合的经典算法) v_JULY_v
2021-05-02 [原]如何在毕业五年内拿到年薪百万 Laurence的技术博客

匿名用户只展示最新 100 条榜单历史,更多历史数据请登录后查看,支持时光机按天筛选

Sponsors

今日解忧 - 赛博修行,舒缓静心,21世纪解压神器!
今日历 - 全球最全的日历,日历届的航空母舰!
百晓生AI - 全能创作助手

猜你喜欢