V2EX › fbichijing 的所有回复 › 第 7 页 / 共 8 页

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

1 2 3 4 5 6 7 8

❮

❯

2022-10-15 21:58:49 +08:00

回复了 fbichijing 创建的主题 › 问与答 › 有没有办法确定买的书是正版？

@icyalala 如果买回来一样不就更亏了。

2022-10-15 17:01:23 +08:00

回复了 fbichijing 创建的主题 › 问与答 › 有没有办法确定买的书是正版？

@swsh007 这种方式不能太好判断吧，给人的感觉似乎过于主观。

2022-10-15 16:52:19 +08:00

回复了 fbichijing 创建的主题 › 问与答 › 有没有办法确定买的书是正版？

@westoy

> 据我所知，当年卓越(亚马逊)和当当、蔚蓝、china-pub 都是北京那边同一个上游渠道供的货，不存在一个平台卖盗版，其他几个大平台卖正版的情况的

对于这方面，我并不了解。人总是容易产生偏见。我稍微叙述一下我自己买过的情况。卓越没退出前，我买实体书多数在这些平台上面买，可能在卓越买的更多。我在当当仅买过几次，但是其中有一次买到缺字少页的，从那次过后基本就没在当当买过了。印象中在卓越买的相当多次之中，好像还没买过让我觉得是盗版的。即便是有，次数少到无法在脑海中留下印象，姑且以没有论之。我无法反驳你的说法，因为我对这方面并不了解。

另外，当年卓越那边的购买评论更像现在的豆瓣读书。而不像现在各个电商书店下面那种几乎清一色如何刷的那些评论了。

2022-10-15 16:12:37 +08:00

回复了 fbichijing 创建的主题 › 问与答 › 有没有办法确定买的书是正版？

我不知道各位是否有这种情况——有一些书你刚买回来的时候，打开之后就不曾怀疑这本书是盗版。一些书看上去怀疑是盗版的种子一开始就不曾在心里出现过。

当然，也有可能仅仅只是这一批次的品控的原因。

最好有一种手段杜绝这种开盲盒一般的性质。品控不行的话或许也就认了。

2022-10-15 16:02:00 +08:00

回复了 fbichijing 创建的主题 › 问与答 › 有没有办法确定买的书是正版？

@westoy 是个人就可能说错话做错事。

> 原则上没理由卖盗版啊。

理论上没有书店想卖盗版，但是否存在出现这种情况的可能性？但这种没有可以核实的手段存在，那买正版书不就如同开盲盒一般？有点怀念亚马逊还在国内卖实体书的时候......

2022-10-14 16:23:31 +08:00

回复了 wyzh97 创建的主题 › Python › Python - Requests 爬虫爬取亚马逊产品页, Headers 被识别为机器人

2022-10-14 16:20:40 刚试了一下，headers 写全可以信息爬出来。

2022-10-10 16:21:46 +08:00

回复了 blackantt 创建的主题 › Python › .*?的缺陷谁能说说？在一个超大字符串(没分行数据)里用 5 个左右的 .*? 会出现不可预料的结果

@wxf666 确实如此。一开始的时候我还喜欢用正则去抓取某些不是很规则的数据，感觉还有那么一丢丢的方便。但随着使用次数的增多，发现直接使用提取器更加简单直接，节省去测试正则的时间。

2022-09-27 01:25:45 +08:00

回复了 Ne 创建的主题 › Python › 请教各位 openpyxl 模块怎样方法才能把不同长度的 list 保存 excel

Pandas 倒省事一些，openpyxl 思路应该也大同小异吧。

```python
import pandas as pd

data1 = [11, 22]
data2 = [33, 44]
data3 = [55, 66, 77, 88]

df = pd.DataFrame([data1, data2, data3])
df = df.T
df.to_excel('test.xlsx', index=False, header=False)
```

2022-09-22 21:51:52 +08:00

回复了 chunhai 创建的主题 › Python › Python 循环其中一行代码异常如何继续执行后续代码？而不是跳过当前循环

def format_text(obj):
if not obj:
return None
return obj.text.strip()

直接搞个函数套上就行了。用 find 应该是 BeautifulSoup 的，find 本身找不到表达式会返回 None ，所以出问题的部分是你获取数值时没有考虑空的情况造成的异常。

如果我自己在写可能会考虑这种方式，感觉方便但是没有点语法雅观。但相比去改变模块里面的数据格式，可能这种来得更简单直接一些。印象中以前写 xpath 时就是这么弄的。

2022-09-15 17:03:12 +08:00

回复了 MrVito 创建的主题 › Python › 爬虫相关，关于 XPath 的疑问

一个有 tbody 一个没有，所以找不到。
这么深层数的筛选器加上那么多的位置 index ，简直是独木桥中的独木桥啊。

2022-09-06 09:32:07 +08:00

回复了 bananahotell 创建的主题 › Python › 需要网页加载了图片后才能通过链接打开爬取怎么解决呢？

刚试了一下，图片链接的话 data-src ，爬取的时候加个 referer 就不会 403

2022-08-31 10:26:07 +08:00

回复了 lanlanye 创建的主题 › Python › 你们说 Python 这个是 Bug 还是 Feature？

很多 Python 书函数部分都会提到，**参数尽量不要用可变对象**。函数参数部分的可变对象在内存中使用了相同的地址，导致实例化后的操作会产生意料之外的行为。

我觉得说是 bug 有点过，至少是可以理解的行为。只是在一开始不知道的时候容易被坑。

```python
class Foo:
def __init__(self, s=None):
self.s = s if s else set()
```

2022-07-29 09:54:08 +08:00

回复了 dearmymy 创建的主题 › Python › 请教下关于 Python 运行 Linux 命令行下怎么方便交互

argparse 之类的。

2022-07-21 16:32:30 +08:00

回复了 PEax 创建的主题 › Python › 新手请教，关于操作列表的问题

直接用 queue 不就完事了吗？

2022-07-10 01:22:38 +08:00

回复了 huzhikuizainali 创建的主题 › Python › Python 中的类和函数的区别是什么？

多写，多看。
觉得老师的话没道理，就不要听。

2022-06-13 16:38:25 +08:00

回复了 LeeReamond 创建的主题 › Python › Python 现代化打包应用到 exe 的方式？

我平时的打包方式：

Window10, python 3.8

pyinstaller -D 多文件
+ nsis 如果有必要的话。

确实，自己写的时候舒服，打包给别人用的时候麻烦。体态臃肿多少感觉丑陋...但考虑到节省了自己很多时间——不管是 code 还是别的——也就不去多想了。

2022-06-08 15:44:38 +08:00

回复了 yrhtiger 创建的主题 › Python › 爬虫外包有人接么

@chengxiao |合理合规的使用爬虫技术有什么问题么？怕是连你自己也不信。你自己写爬虫的时候可看过 robots.txt ？搜索引擎在这里不好做为对比吧。robots.txt 里面，搜索引擎多数(基本上都是)不受限的。如果要遵守君子协议的话，多少网站自己写的爬虫将寸步难行。也因为 robots.txt 是君子协议，写爬虫者可不遵守，才有那么多参数加密的东西出现。硬要提升到法律层面的话，自己写的爬虫强过 robots.txt 就说不过去了。

2022-06-07 12:11:50 +08:00

回复了 fbichijing 创建的主题 › Python › 写了一个路径管理工具，大家试试看给点评价哈

@eudore 是啊，昨天在 Linux 试过，除了界面可能能显示之外其他都不行。如果想适配得检测系统分用不同命令。

2022-06-07 12:09:59 +08:00

回复了 fbichijing 创建的主题 › Python › 写了一个路径管理工具，大家试试看给点评价哈

@kaiger 好

2022-06-07 01:36:04 +08:00

回复了 fbichijing 创建的主题 › Python › 写了一个路径管理工具，大家试试看给点评价哈

@documentzhangx66 我以前也是一直用类似的这种方法，丢进去实在太多了，文件夹，文件，软件，自己写的命令行，自己写的工具……太多了有点记不过来所以才——

1 2 3 4 5 6 7 8

❮

❯