啥事没干今天

还是看了大模型偏见与公平性的综述,继续评估标准,又看了预处理的一些东西

综述看的太无聊太累了

然后就是看了OpenBMB那个大模型知识普及的视频,从注意力到huggingface的小demo
大致流程也跟我之前写的huggingface一致

然后是突发奇想,想要fine-tune一个大模型专门给我写小说看。

这篇综述还是要看完的,但是我决定交给txyz来读了,到时候复制一下就行。

kaggle上用了下gemma,没搞懂,有个prompt格式,我不太理解是为什么
我认为下一步有需要了解训练数据或者微调数据进入大模型之后是如何训练的

大模型语言排行榜

找到一个huggingface上对开源大模型的排行榜
排行榜

关于vercel的一点点

刚刚搞了一下图床的东西
跟随的教程是博客
我的这个博客也是跟着他做的,可以说是相当厉害了

这个图床是怎么做的呢
首先要在github创建一个仓库,然后本地git你想要的图片上去
再用vercel导入刚刚的仓库
在项目domain中新增解析地址,使用已经有的域名进行替换
比如我买了一个域名xxxxxx.com什么的,我就在前面新加一个二级域名比如picpool.xxxxxxxx.com,然后我就在阿里云的DNS解析中为我的主域名添加解析,依据vercel给的配置依次填入解析项中,然后就能用这个url访问我的github的资源。

这个很有趣,相当于把GitHub仓库当作服务器存储空间,而vercel作为服务提供者为你返回资源,我想后期可以写一些api什么的,在我vscode的ai聊天或者别的插件里用用?

把QQ聊天或者甚至是阴阳师当作插件写到vscode里?
开发一个正大光明的摸鱼插件

todo

  • 完成大模型公平性综述
  • 图床
  • 尝试训练一个大模型进行小说生成