V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
lileming1000
V2EX  ›  分享创造

这两个想法哪个更靠谱?快来骂醒我~~

  •  
  •   lileming1000 · 1 天前 · 996 次点击
    想法一:
    最近看了一下很多基础 OCR 是把图片、pdf 的文字全部识别出来,我想做一个把 OCR 识别出来的文字,再进一步转换成结构化的数据。
    比如用户上传发票、餐票、发货单等等图片,使用这个工具自动识别后可以导出 excel 。

    想法二:
    由于我做开发十几年了,现在 AI 很火,所以从去年除开始以归零的心态从零开始学习 AI ,学习了 Python 基础、机器学习、深度学习、pytorch 、transformer 、huggingface 库、模型微调、langchain 、langgraph 、强化学习等等,每个点都有做了一个实战小项目(比如 AI 在线客服、text2sql 等等还有其他项目)。
    但是,但是,但是...没有在企业开发过真正的项目,鉴于现在卖课很疯狂,我自己想录制这一系列课程去卖。

    这两个想法有没有搞头?快来骂醒我(或者给我打个气,哈哈)
    本人今年 40 岁了
    8 条回复    2026-03-26 15:17:25 +08:00
    ingdawn
        1
    ingdawn  
       1 天前
    大胆点 两个都去干
    snowtreetree
        2
    snowtreetree  
       1 天前
    想法一,https://www.volcengine.com/products/ocr ,可能和你的差别是没有导出 Excel 。
    superrrrrrrjudy
        3
    superrrrrrrjudy  
       1 天前
    方案一如果不支持批量,导出 excel 的意义是什么?
    BerniLin
        4
    BerniLin  
       1 天前
    想法一可以看一下 textin ,你说的功能都有了
    wanghui22718
        5
    wanghui22718  
       1 天前
    想法 1 https://github.com/opendatalab/mineru
    MinerU is a tool that converts PDFs into machine-readable formats (e.g., markdown, JSON), allowing for easy extraction into any format.
    largep
        6
    largep  
       1 天前 via Android
    方案 2 可以搞,种一棵树最好的时间是十年前,另一个时间是现在

    你已经领先这个社会 90%的人了,不过注意备着口粮钱💰
    yulgang
        7
    yulgang  
       23 小时 53 分钟前
    想法三、把医院报告单识别归类,出图表
    q2316367743
        8
    q2316367743  
       23 小时 9 分钟前
    想法一属于吃力不讨好,如果你已经有了一个用的人很多的 ocr 软件,之后经过用户调查有这个需求,这个东西才能做,大部分人 ocr 最多识别一下表格
    想法二,卖课的本质是对自己流量的变现,所以卖课的前提是有很大的流量
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   5765 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 130ms · UTC 06:26 · PVG 14:26 · LAX 23:26 · JFK 02:26
    ♥ Do have faith in what you're doing.