套壳 MarkItDown - 在浏览器内将 Office 文件转为 Markdown

278 天前
 miantiao

微软开源了一个 Python 项目 MarkItDown

可以将 Office 文件转换为 Markdown ,一天之内涨了快 10k ⭐ 。

由于是 Python 实现需要服务端,官方没提供在线示例。

我找到一个可以在浏览器内运行的方法,可以将 Office 文件或其他基于文本类的文件转换为干净的 Markdown 。

基于微软开源的 MarkItDown ,完全在浏览器内运行,使用需要网络通畅。

不上传文件到服务器,可放心使用。

https://www.html.zone/markitdown/

2195 次点击
所在节点    分享创造
10 条回复
id7368
278 天前
这域名不错🤓
bxb100
277 天前
一看果然 wasm
metalvest
277 天前
rustpython 转 wasm ?
dcsuibian
277 天前
我正好想要反着的
lamquan
277 天前
扫描版的 PDF 处理不了
miantiao
277 天前
@bxb100 是的,WASM 可以运行一个操作系统了
@metalvest cpython
HuberyPang
277 天前
不错 这个转换后是不是用个托管静态的服务就能运行,比如 vervel 项目开源吗, 学习下
mayun
276 天前
好像没找到官方的文档。只有个 repo
guet
276 天前
@mayun https://markitdown-docs.vercel.app/ 不过貌似是第三方的,倒是示例代码还算全
Visoar
276 天前

报错信息貌似可以处理一下

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1098175

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX