有一个几千行各国语言的脏字列表,就是包括色情,政治一类的. 请教大佬,如何简单的对其进行分类筛选

119 天前
 0001110001011
  1. 按照各个语言进行分类.
  2. 只筛单个语言下的色情 的字

原来我想用 chatgpt. 但是,里面全是被屏蔽的字, 根据没法用

Google gemini 也是一样的

有没有, 那种没有屏蔽色情的在线模型, 让我简单筛选下.

真的是懒得写代码了.

或者有其他的 奇巧淫技 可以实现效果的 ?

求大佬们指点指点

2257 次点击
所在节点    程序员
8 条回复
winterbells
119 天前
换个 prompt 试试?
dji38838c
119 天前
根本不需要什么技巧,只需要学一下怎么写 prompt 。要单选色情的,也是 prompt 改一下就好

Can you determine the specific language of this text without considering its tone or formality? The text is delimited by triple backticks. Please return only the name of the language in one word.
```
脏话写这里
```
paopjian
119 天前
这个在 github 没有公开的列表吗?或者你本地跑一个 llm 看看能不能直接筛一下,本地的应该不存在涩情过滤
yooooho
119 天前
方校长,是你嘛?
kkocdko
119 天前
用 openai 的那些 embedding 模型,是专门拿来做情感分析之类的小任务的,而且相比完整的 gpt 便宜非常多。
Cloud200
118 天前
1. 语言判定分类器,fasttext 什么的
2. openai 有 censor 模型,可以试试
GeekGao
118 天前
如果非要用大语言模型的话,用 mixtral-8x7b-instruct 就可以胜任。
0001110001011
111 天前
还没实验成功, 等实验成功来回复

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1008459

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX