大模型决策
李学龙调研
找了他最近发的很多论文,但是找到可能和大模型决策有关的好像还挺少的
这个老师好像主要是视觉、特征学习、量子计算、图神经网络还有一些遥感方向的东西,而且有很多无监督学习
他还有一个无人机的自主“聊天群”提出“群聊式”对话交互方法,将声音、图像和无人机自身状态等多种信息,通过大模型转换为自然语言的对话形式,实现了用户与无人机,以及无人机与无人机之间自主和直观的交互方式。
可能这个多种智能体协调的跟这个是一个意思?用大模型进行文本交流.
有一个文章链接是关于李学龙教授的临地安防的,里面可能有更细致的内容但是看这个要会员。
有个关于这个新闻的评论异构智能体自主协作,大模型扮演了什么角色?这个里面有对李学龙教授的采访,其中的重点我认为依然是大模型本身的问题可能会带到下游任务中,比如一些伦理道德隐私之类的。
关于近期能找到相关的论文,首先就是这个重磅的CCFA的论文,讲的无人机Optics-driven drone
本文讨论了一种新型的光学驱动无人机(ODD)系统,该系统基于人工智能和激光无线电力传输技术,旨在解决当前无人机由于化学电池能量密度限制而面临的续航能力短,任务覆盖范围和信息感知能力有限等问题。ODD系统可以在飞行中实时报告其位置和任务执行状态给地面站,当需要补充能量时,地面站使用智能视觉跟踪和指向算法来实现稳定的获取、跟踪和指向,然后激活激光向无人机传输能量。无人机上的光电转换模块将接收到的激光能量转换为电能,完成稳定高效的远距离无线能量补给。该系统面临的特定挑战包括目标跟踪、大气湍流缓解和障碍物感知。
为解决这些问题,研究首先提出了一种智能视觉跟踪和指向方法,通过嵌入一个光照敏感模块和一个空间尺度跟踪模块来提高跟踪稳定性,并使用基于金字塔表示的判别相关滤波器来处理复杂图像序列中的大尺度变化。此外,为了缓解大气湍流效应,研究提出了一种基于光斑反馈强化学习的自适应光束整形方法。最后,为确保激光链接的安全,研究提出了一种遮挡检测和激光功率自主调整方法,通过编码和调制激光束,并使用飞行时间方法来估计激光束的传播距离,从而在遇到障碍物时减少激光功率或关闭激光。
通过实验验证,研究展示了提出系统的有效性和优越性,为未来无人机系统的发展提供了参考。这些技术的应用预计将使ODD在未来能够实现全天候(昼夜)、远距离(千米级)和自主的无线能量补充,支持无人机在广阔未知环境中进行更复杂的自主智能任务。此外,ODD系统的技术优势还将支持无人机群体通过地对空一对多无线充电支持协同任务,进一步放大其优势和效率
然后是A communication-based identification of critical drones in malicious drone swarm networks
这篇论文提出了一种基于通信的关键无人机识别方法,用于恶意无人机群的网络。在面对日益增加的恶意无人机群攻击时,准确识别关键的恶意无人机对于优化定向能量攻击并最大化其效果至关重要。然而,当前关于关键无人机识别的研究仍处于初级阶段,几乎完全依赖于不考虑无人机群分布特性的传统中心性方法。这导致关键无人机的识别不准确,进而降低了定向能量攻击的效率。为了解决这一问题,本文提出了一种新的基于无人机分布特性、通信强度和通信规模的关键无人机识别方法。该方法首先构建了一个基于3D位置和交互范围的无人机群动态通信预测网络模型,以预测无人机之间的动态通信。然后,本文提出了一种新的基于动态巨大连通分量(GCC)的规模强度中心性(DGSIC)方法,结合了动态通信预测网络的局部、全局和社区结构,以识别具有更强通信能力的关键节点。此外,通过动态策略,在每一步迭代中识别一个关键节点,考虑网络配置的演变,确保识别的节点在当前网络中仍是最关键的。此外,还采用了优先策略,优先识别在GCC中可以显著影响网络连通性和通信的节点。DGSIC优化了定向能量攻击的攻击顺序,有助于快速瓦解恶意无人机群。通过在四个模拟网络和八个真实世界网络上的广泛实验,证明了DGSIC在鲁棒性和级联故障性能方面的优越性。
Pessimistic value iteration for multi-task data sharing in Offline Reinforcement Learning (没找到原文,只看到了介绍)
本文研究了在离线强化学习(Offline Reinforcement Learning)中进行多任务数据共享的方法。尽管离线强化学习已经在从固定数据集中学习特定任务的策略方面显示出良好的效果,但其成功往往严重依赖于给定数据集的覆盖范围和质量。在特定任务数据集有限的情况下,一种自然的方法是利用其他任务的数据集来改进离线强化学习,即进行多任务数据共享(Multi-Task Data Sharing,MTDS)。然而,直接共享其他任务的数据集会加剧离线强化学习中分布偏移的问题。
为了解决这个问题,本文提出了一种基于不确定性的MTDS方法,该方法不需要数据选择,可以直接共享整个数据集。在基于集合的不确定性量化基础上,他们对共享的离线数据集进行悲观的值迭代,为单任务和多任务的离线强化学习提供了一个统一的框架。此外,还提供了理论分析,证明了方法的最优性差距只与共享数据集的期望数据覆盖范围有关,从而解决了数据共享中的分布偏移问题。
在实验方面,他们发布了一个MTDS基准,并从三个具有挑战性的领域收集了数据集。实验结果表明,在具有挑战性的MTDS问题中,算法优于之前的最先进方法。
论文确实好少,我就找了其它一些资料
一个GitHub仓库里面列举了很多大模型和多智能体相关的文章,仓库在这里
Multi-Agent Consensus Seeking via Large Language Models
这篇论文研究了基于大型语言模型(LLMs)的多智能体系统在协作中达成共识的概念。研究发现LLM驱动的智能体在共识寻求中主要采用平均策略,同时分析了智能体数量、个性和网络拓扑对谈判过程的影响。实验结果显示,增加智能体数量可以减轻系统的幻觉,稳定群体决策。
Large Language Model based Multi-Agents: A Survey of Progress and Challenges
一篇综述,如果有必要的会仔细看看扩充一下知识面
这篇论文介绍了一个名为LLaMAC的框架,旨在增强大规模多Agent环境中基于大型语言模型的代理的协调和决策能力。该框架从多Agent强化学习中的actor-critic框架中汲取灵感,通过模块化和高效利用token的解决方案有效地应对了语言模型和多Agent系统中的挑战。
AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation
这是一个能利用大模型构建多智能体的框架,允许开发人员构建通过多个代理进行对话以完成任务的LLM应用。AutoGen代理是可定制的、可对话的,并且可以在使用LLMs、人类输入和工具的各种模式下运行。
MULTI-AGENT COLLABORATION: HARNESSING THE POWER OF INTELLIGENT LLM AGENTS
该论文提出了一种通过利用多智能代理系统的力量来增强大型语言模型(LLMs)能力的框架,引入了一个协作环境,多个智能代理组件共同处理复杂任务,提高效率。多智能代理系统中的各个代理相互协作,共同实现共享目标.
LLM HARMONY: MULTI-AGENT COMMUNICATION FOR PROBLEM SOLVING
这篇论文介绍了一种新颖的多智能体通信框架,旨在增强大型语言模型(LLMs)在自主问题解决方面的能力。该框架利用多个具有不同角色的LLM代理进行角色扮演通信,为处理各种问题场景提供了一种细致且灵活的方法。