2025-02-01 |
一次性总结数十个具身模型(2024-2025):从训练数据、动作预测、训练方法到Robotics VLM、VLA(如π0等) |
v_JULY_v |
|
2025-01-31 |
一文速览DeepSeekMoE:从Mixtral 8x7B到DeepSeekMoE(含MoE架构的实现及DS LLM的简介) |
v_JULY_v |
|
2025-01-27 |
一文通透让Meta恐慌的DeepSeek-V3:在MoE、GRPO、MLA基础上提出Multi-Token预测(含FP8训练详解) |
v_JULY_v |
|
2025-01-27 |
RoboVLM——通用机器人策略的VLA设计哲学:如何选择骨干网络、如何构建VLA架构、何时添加跨本体数据 |
v_JULY_v |
|
2025-01-25 |
iDP3的人形遥操代码分析:从数据收集、数据转换到VR安装、人形机器人遥控 |
v_JULY_v |
|
2025-01-22 |
一文速览推理模型DeepSeek R1:如何通过纯RL训练以比肩甚至超越OpenAI o1(含Kimi K1.5、QwQ-32B的解读) |
v_JULY_v |
|
2025-01-20 |
iDP3的训练与部署代码解析:从数据可视化vis_dataset.py、训练脚本train.py到部署脚本deploy.py |
v_JULY_v |
|
2025-01-16 |
iDP3的Learning代码解析:逐步分解iDP3的数据集、模型、动作预测策略代码(包含2D和3D两个版本) |
v_JULY_v |
|
2025-01-12 |
一文速览CogACT及其源码剖析:把OpenVLA的离散化动作预测换成DiT,逼近π0(含DiT的实现) |
v_JULY_v |
|
2025-01-11 |
一文通透OpenVLA及其源码剖析——基于Prismatic VLM(SigLIP、DinoV2、Llama 2)及离散化动作预测 |
v_JULY_v |
|
2024-12-31 |
GRAPE——RLAIF微调VLA模型:通过偏好对齐提升机器人策略的泛化能力 |
v_JULY_v |
|
2024-12-29 |
Diffusion Transformer(DiT)——将扩散过程中的U-Net换成ViT:近频繁用于视频生成与机器人动作预测(含清华PAD详解) |
v_JULY_v |
|
2024-12-24 |
YAY Robot——斯坦福和UC伯克利开源的:人类直接口头喊话从而实时纠正机器人行为(含FiLM详解) |
v_JULY_v |
|
2024-12-22 |
从DINO、Grounding Dino到DINOv2、DINO-X——自监督视觉Transformer的升级改进之路(基于ViT) |
v_JULY_v |
|
2024-12-08 |
一文速览mamba的各种变体与改进:从MoE-Mamba、Vision Mamba、VMamba、Jamba到Falcon Mamba |
v_JULY_v |
|
2024-12-04 |
一文通透vLLM与其核心技术PagedAttention:减少KV Cache碎片、提高GPU显存利用率(推理加速利器) |
v_JULY_v |
|
2024-12-02 |
从Octo与TinyVLA、DeeR-VLA、3D-VLA——OpenVLA之外的VLA模型的持续升级 |
v_JULY_v |
|
2024-11-26 |
斯坦福泡茶机器人DexCap源码解析:涵盖收集数据、处理数据、模型训练三大阶段 |
v_JULY_v |
|
2024-11-26 |
Diffusion Policy——斯坦福UMI所用的动作预测算法:基于扩散模型的扩散策略(从原理到其编码实现) |
v_JULY_v |
|
2024-11-26 |
英伟达HOVER——用于人形机器人的多功能全身控制器:整合不同的控制模式且实现彼此之间的无缝切换 |
v_JULY_v |
|
2024-11-26 |
多模态PaliGemma 2(含1代):Google推出的基于SigLIP和Gemma 2的视觉语言模型(附SigLIP详解) |
v_JULY_v |
|
2024-11-26 |
π0——用于通用机器人控制的VLA模型:一套框架控制7种机械臂(基于PaliGemma和流匹配的3B模型) |
v_JULY_v |
|
2024-11-26 |
RDT——清华开源的双臂机器人“扩散动作大模型”(基于DiT改造而成):先预训练后微调,支持语言、图像、动作多种输入 |
v_JULY_v |
|
2024-11-26 |
字节GR2——在大规模视频数据集上预训练且机器人数据上微调,随后预测动作轨迹和视频(含GR1详解) |
v_JULY_v |
|
2024-11-26 |
UC伯克利HIL-SERL——结合视觉和人类示教与纠正的RL方法(直接真实环境中RL开训,可组装电脑主板和插拔USB) |
v_JULY_v |
|
2024-11-26 |
机器人领域中的scaling law:清华高阳团队通过复现斯坦福UMI——探讨数据规模化定律(含UMI的复现关键) |
v_JULY_v |
|
2024-11-26 |
斯坦福iDP3——改进3D扩散策略以赋能人形机器人的训练:不再依赖相机校准和点云分割(含DP3的详解) |
v_JULY_v |
|
2024-11-26 |
基于人类视频的模仿学习与VLM推理规划:从DexMV、MimicPlay、SeeDo到人形OKAMI、Harmon(含R3M的详解) |
v_JULY_v |
|
2024-11-26 |
一文通透OpenAI o1:从CoT、Quiet-STaR、Self-Correct、Self-play RL、MCTS等技术细节到工程复现 |
v_JULY_v |
|
2024-10-12 |
从MDM、RobotMDM到UC San Diego的Exbody(含Exbody 2)——人体运动扩散模型:赋能机器人的训练 |
v_JULY_v |
|
2024-10-10 |
H2O与OmniH2O——全身远程操作且RL训练的人形机器人(含师生学习与策略蒸馏详解) |
v_JULY_v |
|
2024-10-08 |
VLM驱动机器狗——从UMI on Legs到Helpful DoggyBot:分别把机械臂装到机器狗背上、夹爪装到机器狗嘴里 |
v_JULY_v |
|
2024-10-01 |
Fast-UMI——改进斯坦福UMI的硬件:用RealSense T265替代SLAM且实现机械臂的迁移与平替 |
v_JULY_v |
|
2024-09-19 |
ReKep——李飞飞团队提出的让机器人具备空间智能:基于VLM模型GPT-4o和关系关键点约束(含源码解析) |
v_JULY_v |
|
2024-08-26 |
一文通透DeepSeek-V2(改造Transformer的中文模型):详解MoE、GRPO、MLA |
v_JULY_v |
|
2024-08-16 |
让AI写论文——全流程全自动的AI科学家:基于大模型提炼idea、写代码、做实验且最终写成论文 |
v_JULY_v |
|
2024-08-12 |
2024自动驾驶(多模态)大模型综述:从DriveGPT4、DriveMLM到DriveLM、DriveVLM |
v_JULY_v |
|
2024-08-09 |
微调LLama 3.1——七月论文审稿GPT第5.5版:拿早期paper-review数据集微调LLama 3.1 |
v_JULY_v |
|
2024-07-28 |
SRT——基于模仿学习的手术机器人:来自约翰霍普金斯大学和斯坦福ALOHA团队 |
v_JULY_v |
|
2024-07-24 |
一文速览Llama 3.1——对其92页paper的全面细致解读:涵盖语言、视觉、语音的架构、原理 |
v_JULY_v |
|
2024-07-22 |
一文通透TTT:让RNN的隐藏层变成可学习的函数——继mamba之后也想超越Transformer |
v_JULY_v |
|
2024-07-12 |
UC San Diego的三大机器人:AnyTeleop、Open-TeleVision、Bunny-VisionPro——从RGB相机到VR远程控制机器人 |
v_JULY_v |
|
2024-07-03 |
一文通透mamba2「力证Transformer are SSM」:从SSM、半可分矩阵、SMA、SSD到mamba2 |
v_JULY_v |
|
2024-06-29 |
一文速览Gemma及其微调(第5.2版):通过我司七月的早期paper-7方面review数据集微调Gemma2 |
v_JULY_v |
|
2024-06-24 |
微调LLama 3——七月论文审稿GPT第5版:拿早期paper-7方面review数据集微调LLama 3 |
v_JULY_v |
|
2024-06-23 |
康奈尔大学之论文审稿模型Reviewer2及我司七月对其的实现(含PeerRead) |
v_JULY_v |
|
2024-06-22 |
人体姿态估计WHAM与手势估计HaMeR——人形机器人重定位的关键技术之一 |
v_JULY_v |
|
2024-06-19 |
HumanPlus(斯坦福人形机器人)的代码解读与复现关键:从HST到HIT、HardWare |
v_JULY_v |
|
2024-06-16 |
HumanPlus——斯坦福ALOHA团队开源的人形机器人:融合影子学习技术、RL、模仿学习 |
v_JULY_v |
|
2024-06-15 |
LeRobot——Hugging Face打造的机器人领域的Transformer架构 |
v_JULY_v |
|
2024-06-03 |
DexCap——斯坦福李飞飞团队泡茶机器人:更好数据收集系统的原理解析、源码剖析 |
v_JULY_v |
|
2024-05-23 |
一文通透想取代MLP的KAN:通俗理解Kolmogorov-Arnold定理和KAN的方方面面 |
v_JULY_v |
|
2024-05-07 |
基于大模型的idea提炼与创意生成:从让chatgpt直接生成创意到围绕论文和引用提炼idea之ResearchAgent |
v_JULY_v |
|
2024-04-19 |
一文速览Llama 3:从Llama 3的模型架构到如何把长度扩展到100万——基于NTK-aware插值 |
v_JULY_v |
|
2024-04-19 |
七月论文审稿GPT第4.2版:通过15K条paper-review数据微调Llama2 70B(含各种坑) |
v_JULY_v |
|
2024-04-13 |
从零实现本地知识库问答——详解基于OCR和文本解析器的新一代RAG引擎:RAGFlow(含源码剖析) |
v_JULY_v |
|
2024-04-12 |
提升大模型数据质量的三大要素:找到早期paper且基于GPT摘要出来7方面review——七月论文审稿GPT第4.5/4.6/4.8版 |
v_JULY_v |
|
2024-04-05 |
Google视觉机器人超级汇总:从RT、RT-2到AutoRT/SARA-RT/RT-Trajectory、RT-H |
v_JULY_v |
|
2024-03-28 |
七月论文审稿GPT第4版:通过paper-review数据集微调Mixtral-8x7b,对GPT4胜率超过80% |
v_JULY_v |
|
2023-08-24 |
大模型并行训练指南:通俗理解Megatron-DeepSpeed之模型并行与数据并行 |
v_JULY_v |
|
2023-08-12 |
学术论文GPT的源码解读与微调:从ChatPaper到七月论文审稿GPT第1版 |
v_JULY_v |
|
2023-08-05 |
LLM高效参数微调方法:从Prefix Tuning、Prompt Tuning、P-Tuning V1/V2到LoRA、QLoRA(含对模型量化的解释) |
v_JULY_v |
|
2023-07-05 |
baichuan7B/13B的原理与微调:从baichuan的SFT实现到baichuan2的RLHF实现 |
v_JULY_v |
|
2023-07-05 |
基于LangChain+LLM的本地知识库问答:从企业单文档问答到批量文档问答 |
v_JULY_v |
|
2023-07-05 |
医疗金融法律大模型:从ChatDoctor到BloombergGPT/FinGPT/FinBERT、ChatLaw/LawGPT_zh |
v_JULY_v |
|
2023-07-02 |
图像分割的大变革:从SAM(分割一切)到FastSAM、MobileSAM |
v_JULY_v |
|
2023-06-22 |
AI绘画与多模态原理解析:从CLIP到DALLE1/2、DALLE 3、Stable Diffusion、SDXL Turbo |
v_JULY_v |
|
2023-04-30 |
AI绘画能力的起源:从VAE、扩散模型DDPM、DETR到ViT/Swin transformer |
v_JULY_v |
|
2023-04-12 |
从零实现Transformer的简易版与强大版:从300多行到3000多行 |
v_JULY_v |
|
2023-04-06 |
详解带RLHF的类ChatGPT:从TRL、ChatLLaMA到ColossalChat、DSC |
v_JULY_v |
|
2023-03-31 |
ChatGLM两代的部署/微调/实现:从基座GLM、ChatGLM的LoRA/P-Tuning微调、6B源码解读到ChatGLM2的微调与实现 |
v_JULY_v |
|
2023-03-22 |
LLaMA的解读与其微调:Alpaca-LoRA/Vicuna/BELLE/中文LLaMA/姜子牙/LLaMA 2 |
v_JULY_v |
|
2023-03-14 |
LLM/ChatGPT与多模态必读论文150篇(已更至第101篇) |
v_JULY_v |
|
2023-02-10 |
强化学习极简入门:通俗理解MDP、DP MC TC和Q学习、策略梯度、PPO |
v_JULY_v |
|
2023-01-15 |
ChatGPT技术原理解析:从RL之PPO算法、RLHF到GPT4、instructGPT |
v_JULY_v |
|
2022-10-23 |
Transformer通俗笔记:从Word2Vec、Seq2Seq逐步理解到GPT、BERT |
v_JULY_v |
|
2022-10-11 |
22下半年:来长沙建第二支团队与所读的33本书(含哲学政法经济书单/笔记) |
v_JULY_v |
|
2022-05-29 |
20 21九死一生、22上半年读20本书(含15本管理书单/笔记):继续百年征程 |
v_JULY_v |
|
2021-09-17 |
通俗理解卡尔曼滤波(无人驾驶感知融合的经典算法) |
v_JULY_v |
|
2021-05-02 |
[原]如何在毕业五年内拿到年薪百万 |
Laurence的技术博客 |
|