【[61星]verl-agent：为LLM/VLMAgent训练提供高效的强化

爱生活爱珂珂 2025-05-20 13:59:51

【[61星]verl-agent：为LLM/VLM Agent训练提供高效的强化学习框架。亮点：1. 支持多轮交互，突破长序列优化瓶颈；2. 提供多种强化学习算法，如GiGPO、GRPO和PPO；3. 适配多种环境，包括ALFWorld、WebShop和Sokoban】

'verl-agent is an extension of veRL, designed for training LLM/VLM agents via RL.'

GitHub: github.com/langfengQ/verl-agent

强化学习 LLM训练多轮交互 AI创造营

0 阅读：0

快报！快报！中国又有大动作了。美国这次真是“万万没想到”！！复旦大学这次

【2评论】【21点赞】

芯片 it芯片

微软把GitHubCopilot也开源了，而且是MIT协议。最主要原

微软 GitHub copilot github copilot

不得不说，AI越来越真实了。

【10评论】【10点赞】

ai 人工智能

中美真正的较量开始了！这次较量再度升级！你发现没？美国刚宣布全球禁售华为昇

【2评论】【7点赞】

华为芯片

之前前面微软刚刚关闭国内的团队，一刻也不放松看到最近华为鸿蒙操作系统放大招，

【2点赞】

微软华为鸿蒙系统 ai

中国电脑捅破了那窗户纸。昨天成都发布的鸿蒙电脑，是华为五年磨一剑的成果，上万人参

【5评论】【2点赞】

华为鸿蒙系统成都余承东 ai

外网再次炸锅！这次不是歼10，但却更加扎心，就连国外CEO也忍不住发声：美国落后

ai 比尔·盖茨

英伟达AI总监JimFan近期分享了关于“物理AI”(PhysicalAI

【1评论】

ai 机器人英伟达物理人工智能

爱生活爱珂珂

感谢大家的关注

【[65星]dexterity-aha-guide：从零到掌握通用灵巧手的全方位

【[61星]verl-agent：为LLM/VLM Agent训练提供高效的强化

【[57星]Voice_Extractor：从多说话人的音频中提取目标说话人的语

【[160星]Magentic-UI：微软推出的人性化网页Agent，让复杂的网

【[1.5k星]microsoft/edit：致敬经典MS-DOS编辑器的现代文

微软宣布将VS Code转型为开源AI代码编辑器（锐评见长图）微软在2025年B

NVIDIA发布物理AI、机器人和国家级AI工厂发展路线图（锐评见长图）围绕着将

微软：“万物皆可Agent，一切皆为Agent”（附锐评见长图）微软在Build

早！[太阳] 早安

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

目前接近完美的6部手机，有你在用的嘛？

华为自研鸿蒙电脑，没有键盘！是一整块可折叠的超大屏幕，然后内置大面积线性马达，通

这中控屏幕看起来有点丑

昨天，华为终端发布华为nova全球代言人易烊千玺手持华为nova14系列的海报

国外拆解Mate30，零部件国产率仅为30%，国外拆解Mate30 5G，零部

字节的工资是真的高啊！

华为又整出了非凡大师鸿蒙电脑。这又开创了一种电脑新型态，折叠电脑，而且还是纯

格力电器董明珠董事长的“海归论”，遭到一些人的批评和质疑，个人觉得大可不必。

美国最近突然宣布，不准全球任何公司用华为的昇腾芯片！想用必须先问美国同意。这一下

刚刚！#一加13T#首销10分钟破两亿！这手机我也用了几天，最大的感受是真爽，单

一加手机设计不套娃了，上回13T是一个样，现在Ace5至尊又另一个样。至于金色机

我问我老公:小米花135亿就造出了3纳米芯片，是真的吗？老公斜我一眼:如果从

华为牛气冲天啊！直接甩出两款鸿蒙电脑，一个比一个炸裂，MateBookPro起

5月19日下午五点前，刚刚发生的最新消息！第一、就在刚刚！5月19日，华为在

第一时间拿到，华为Nova14Pro，手感很棒，非常精致，全系支持国补[捂脸

华为nova1412+256GB2699元12+512GB2999元12+5

华为是真有想法，这个手机壳估计会火。手机壳上有个电子墨水屏，用NFC供电，可以

华为发布会华为nova14Ultra产品力好强，三颗镜头都是RYYB

【Siri升级迟迟未到，消息称苹果AI投入犹豫不决、后续功能不再“画大饼”】在