狗窝🐕

Bias and Fairness in Large Language Models A Survey

发表于2024-03-05|更新于2024-03-13|大模型论文

公平性与偏见首先就是大模型的背景，大模型在大语料库的训练下具有很强的零或少样本的学习能力，能在很多下游任务上取得很好的效果，但正因如此，大语料库隐含的偏见有可能被大模型捕捉而学习，从而影响下游任务产生偏见。这篇文章主要从三个方面介绍评估矩阵评估数据集去偏算法文章的贡献有 NLP 的社会偏见和公平定义的巩固、形式化和扩展偏差评估指标的调查和分类用于偏差评估的数据集的调查和分类，以及公开数据集的汇编公开数据集减轻偏见技术的调查和分类公式化大模型偏见与公平性对大模型的定义文章将大模型定义为：由 θ 参数化的大型语言模型 (LLM) M 是一种基于 Transformer 的模型，具有自回归、自动编码或编码器-解码器架构，已在包含数亿到数万亿个标记的大型语料库上进行了训练。对大模型偏见的定义社会偏见与公平性这里有讲到当一个标签被贴到一个群体上使得群体的边界合法化，此时就强调了这个群体与其它群体之间的差异，而这个差异则会导致强化社会等级制度和权力失衡，通常会带来非常真实和物质的后果，可能导致隔离、边缘化和压迫。社会群体的定义具有相同身 ...

llama2cpp

发表于2024-03-05|更新于2024-03-07|大模型实践

本地部署llama2根据B站视频攻略做的部署，无需GPU，本地部署Llama2-13B模型首先就是要在windows环境下安装wsl，这个是模拟linux环境的查看有哪些linux系统可以进行安装1wsl --list --online 复制你想安装的系统名称进行安装1wsl --install -d sys_name 再根据要求创建用户名密码就行更换存储区域，默认下载的wsl是下载在C盘，需要更换一下 ~~我的C盘不多了。1234wsl -l -v # 显示已经安装了的系统wsl --export sys_name target_dir # sys_name=你的系统命， target_dir就是目标路径，我的是D：\Ubuntu-22.04.tarwsl --unregister sys_name # 将原来的删除wsl --import sys_name source_dir target_dir --version 2 # source_dir就是你希望它存储的位置启动！1wsl --distribution sys_name --user user_name # us ...

vscode插件 hexo_helper

发表于2024-03-04|更新于2024-03-13|学习日常

my first blog在学习过程中突然有了记笔记的想法，这样可以时时记录学习过程，免得导师问这周干了什么的时候只能擦汗，于是就想到了搭建个人博客，用日记记录日常学习的过程。因为文档生成有一个固定的模板，方便博客框架对文档信息进行渲染显示，因此为了避免每次都需要复制粘贴这个模板，我就用自动化脚本的方式来完成这一过程。保存时运行脚本vscode中下载run on save插件，并在setting.json中文件进行设置 12345678"emeraldwalk.runonsave": { "commands": [ { "match": "\\.md$", "cmd": "python ${workspaceFolder}/your_script_path.py ${file}" } ]} 这样就能 ...

公告

为了创建一个既风趣又独特的博客公告，可以考虑结合以下元素：个性化和真实性：向读者展示你的个性和独特视角，不要害怕展现真实的自我。引人注目的内容：使用吸引人的语言和视觉效果来抓住读者的注意力。社交媒体互动：利用社交媒体的力量，以不同的方式多次宣布你的博客，分享有关博客的重要更新或特色。一个简洁版的公告示例可能是：“探索未知，发现乐趣。欢迎来到我的博客——一个充满智慧和笑声的地方。让我们一起踏上这段旅程，发现隐藏在文字之下的宝藏。”