xoxo419
V2EX  ›  问与答

有一个关于旅游的 APP,复制小某书的旅游攻略文章后,就可以把地点提取出来。其技术原理是什么 如何区别哪些文字是地点?

  •  
  •   xoxo419 · Nov 24, 2024 · 2390 views
    This topic created in 540 days ago, the information mentioned may be changed or developed.
    9 replies    2024-11-24 23:47:08 +08:00
    mumbler
        1
    mumbler  
       Nov 24, 2024
    以前很难,现在有大模型就太简单了,监控剪贴板,把文字内容发给大模型去识别是否是旅游攻略,如果是提取地点
    yinmin
        2
    yinmin  
       Nov 24, 2024 via iPhone
    处理这种业务,30B 规模的 ai 大模型很完美了,我估计最新的 7B 、11B 也可以。本地部署 mac mini M4 pro 能跑到 100+token/s
    WaveFunction
        3
    WaveFunction  
       Nov 24, 2024 via Android   ❤️ 3
    关键词:实体命名识别( NER )
    iOCZS
        4
    iOCZS  
       Nov 24, 2024
    你是一个旅行家,请帮从这段旅游攻略中提取出描述的地址信息。
    opengps
        5
    opengps  
       Nov 24, 2024
    地点容易,先用爬虫爬取相关的资源,比如行政区域名称,地图 poi 名称
    paopjian
        6
    paopjian  
       Nov 24, 2024
    通用地址名词使用 NER,配合用户自己打标签, 压根不用 LLM 就能做到
    hertzry
        7
    hertzry  
       Nov 24, 2024
    命名实体识别 (NER) 是一项任务,其中模型必须找到输入文本的哪些部分对应于诸如人员、位置或组织之类的实体。
    yufeng0681
        8
    yufeng0681  
       Nov 24, 2024
    @WaveFunction #3 以前还要专门的 NLP 工程师,现在被 ai 平替了
    WaveFunction
        9
    WaveFunction  
       Nov 24, 2024 via Android
    @yufeng0681 是的,基础 NLP 任务现在基本上 LLM 一把梭了
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3122 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 51ms · UTC 11:19 · PVG 19:19 · LAX 04:19 · JFK 07:19
    ♥ Do have faith in what you're doing.