Toapi 正式发布 - 再也不愁没有数据!

2017-12-26 17:26:38 +08:00
 prasanta

Toapi - 再也不愁没有数据!

Github: https://github.com/gaojiuli/toapi

进入 Toapi

你是否有这样的需求,有一个很好的 idea,却没有很好的数据来源,好不容易找到相关数据来源的网站,却发现没有 API (或许有但需要收费),那么,我可以告诉你,Toapi 为此提供了很好的解决方案 ,它可以:

它的最后效果

// http://127.0.0.1:5000/pic/?q=coffee

{
    "Pixabay": [
        {
            "img": "https://cdn.pixabay.com/photo/2017/06/21/05/28/coffee-2426110__340.png"
        },
        {
            "img": "/static/img/blank.gif"
        }
    ],
    "Pexels": [
        {
            "img": "https://images.pexels.com/photos/302899/pexels-photo-302899.jpeg?h=350&auto=compress&cs=tinysrgb"
        },
        {
            "img": "https://images.pexels.com/photos/34085/pexels-photo.jpg?h=350&auto=compress&cs=tinysrgb"
        }
    ]
}

Toapi 是一个用Python编写的开源项目,若你有特殊的功能需求,可以自己定制,我们为你提供完整的生态:

使用 Toapi

让我们看下面这个简单的例子 - 仅仅是演示 目标网站是hackernews

from toapi import XPath, Item, Api, Settings


class MySettings(Settings):
    web = {
        "with_ajax": True,
        "request_config": {},
        "headers": None
    }

api = Api('https://news.ycombinator.com', settings=MySettings)

class Post(Item):
    url = XPath('//a[@class="storylink"]/@href')
    title = XPath('//a[@class="storylink"]/text()')

    class Meta:
        source = XPath('//tr[@class="athing"]')
        route = {'/news?p=:page': '/news?p=:page'}

class Page(Item):
    next_page = XPath('//a[@class="morelink"]/@href')

    class Meta:
        source = None
        route = {'/news?p=:page': '/news?p=:page'}

    def clean_next_page(self, next_page):
        return "http://127.0.0.1:5000/" + next_page

api.register(Page)
api.register(Post)

api.serve()
# Visit http://127.0.0.1:5000/news?p=1

不到四十行代码,你已经拥有了hackernews的 API 服务,介绍下目前官方提供的模板:

最后

Toapi 不会停止进步,从简陋的第一版到现在基本功能完善的版本,一个月来我们有近 400 次 commits,其中辛苦不必多说。

我们诚恳地希望开发者们使用 Toapi 来构建服务,并提出你的宝贵意见,上手 Toapi 是一件极其简单的事情,我们希望看到 Toapi 能为开源社区带来一点贡献,能为你减少构建 API 的麻烦。

Toapi 开发团队(@gaojiuli, @howie6879, @wuqiangroy)

6547 次点击
所在节点    Python
32 条回复
Ehco1996
2017-12-27 08:34:08 +08:00
这个真不错!
qsnow6
2017-12-27 09:02:15 +08:00
可以来个演示站
omph
2017-12-27 09:03:56 +08:00
是个在线爬虫服务啊
xzg1993
2017-12-27 09:10:37 +08:00
不太懂其中的原理,很好奇,是可以把别人家的网站 转换成 api 接口吗?? 好神奇
ruter8
2017-12-27 09:28:12 +08:00
@qsnow6 看 #5 我写的,可以自己克隆了跑一下


@xzg1993 这个其实就相当于爬虫,把网页取下来,然后获取对应元素的内容
mrcode
2017-12-27 09:56:01 +08:00
很好,先 star 一波,不过这种好像不能跑动态服务把。
prasanta
2017-12-27 10:20:01 +08:00
@mrcode 可以跑,所有动态页面都能跑
vimiix
2017-12-27 10:48:32 +08:00
mark
tflz514
2017-12-27 10:53:12 +08:00
👍
Kirikora
2017-12-27 15:06:20 +08:00
已 star~ 不过感觉看文档还不是很明白用法,这帖子里看的还明了点。。 改天把官方模板看一下
prasanta
2017-12-27 15:17:06 +08:00
@xzg1993 你的描述很准确
vimiix
2017-12-28 00:43:55 +08:00
恭喜一天斩获 300+star,学习一下

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/417801

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX