【求解】从百度地图抓取北京市所有地标的坐标信息

2010-10-10 17:13:24 +08:00
 789shi
最近在做一个项目,需要从百度地图抓取北京市所有地标的坐标信息(放大到最大状态,所有有名字的地标,包括某某小吃某某饭馆之类的)

但是目前只想到传入关键字到百度地图,然后收集返回的结果
这就要求作为种子的关键字要尽可能的全

但是这不是解决抓取“所有地标”的最优办法,因为关键字考虑的不全的话,就抓不全地标

大家有没有好的办法,可以将北京市的每一个地标都能遍历出来?
7969 次点击
所在节点    问与答
9 条回复
mactive
2010-10-10 17:20:42 +08:00
地图上的数据是取不下来的吧 那时 一个个的方块图。
而且如果你不停的读取他的图片数据 可能还会被封IP。
至少 google 和 yahoo 地图服务器 都有防下载机制。
789shi
2010-10-10 17:29:41 +08:00
@mactive

IP可以用代理,被封就换
而且地图也不只是一个个的方块的,监测下传输的数据你就会发现,每个地标的经纬度和分类信息都可以抓到

现在唯一做不到的就是,如何遍历出来北京市所有的地标~
marshluca
2010-10-10 17:44:03 +08:00
Baudi地图,Google中国地图的数据都是引用Mapabc。
可以找Mapabc买数据
marshluca
2010-10-10 17:45:04 +08:00
搞错了 原来百度是Mapbar的。
mactive
2010-10-10 18:11:32 +08:00
@marshluca 07年我在Mapabc上过班,google 每年支付的费用在千万元级别。
google一开始想自己搞测绘,不过国内不给批准。
789shi
2010-10-10 18:31:51 +08:00
@mactive

这就是手里有数据的好处~

谁手里把握的数据多,谁就是老大~
skyonline
2010-10-10 18:34:38 +08:00
mapabc是google收购了的,mapbar是baidu收购的。
marshluca
2010-10-10 20:13:53 +08:00
@skyonline 人家Mapabc今年刚刚在美国上市呀

@mactive 这次你亏啦
mactive
2010-10-10 21:13:43 +08:00
@marshluca 呵呵 不亏 好像是 高德AutoNavi 上市了吧 mapabc是他的子公司
等我的公司上市吧

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/3233

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX