V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  wqzjk393  ›  全部回复第 16 页 / 共 33 页
回复总数  649
1 ... 12  13  14  15  16  17  18  19  20  21 ... 33  
哦错了,导数第二行改一下:rubDF.drop_duplicates(["corp", "stype", "mktime"],keep='first',inplace=True)
data = [["corp1", "stype1", "mktime1", "serNum1", "status1", "20kg","B1","C1","D1"],
["corp1", "stype1", "mktime1", "serNum2", "status3", "20kg","B1","C1","D1"],
["corp1", "stype1", "mktime1", "serNum2", "status5", "30kg","B1","C1","D1"],
["corp1", "stype1", "mktime1", "serNum7", "status3", "40kg","B1","C1","D1"],
["corp2", "stype3", "mktime4", "serNum4", "status9", "A1","B1","C1","D1"],
["corp2", "stype1", "mktime67", "serNum2", "status4", "20kg","B1","C1","D1"]]
rubDF = pd.DataFrame(data,columns=["corp", "stype", "mktime", "serNum", "status", "A","B","C","D"])
rubDF['sortindex'] = rubDF.apply(lambda x:1 if x.A == '20kg' else 2,axis=1)
rubDF.sort_values(by=['sortindex'],ascending=True,inplace=True)
rubDF.drop_duplicates(['A'],keep='first',inplace=True)
print(rubDF)

不知道是不是符合需求
2019-08-09 11:19:15 +08:00
回复了 joson1205 创建的主题 Python Python 读取 Excel 超大数据文件问题
df = pd.read_excel(sheetname=None)
df1 = df[‘ Sheet1 ’]
df2 = df[‘ Sheet2 ’]
1 分钟之内就能读完了,不慢了吧。。
2019-08-07 15:30:50 +08:00
回复了 jimplanck 创建的主题 问与答 如何优雅的打广告,让年轻人不厌恶。
康美药业、利群,了解一下
不管未来多么阴暗多么看不到希望,都不要停止学习。这年头,能让人施以尊敬的,除了业内大佬就是持续学习者了。你要这么想,你和体力劳动者最大的区别不就是多了那么多年的学习么,如果离开学校停止了学习,那差距就会慢慢拉近,你这么多年学习带来的优势也会慢慢消失。其实现在并不是大学生多了所以不值钱了,而是大学生毕业以后就彻底不再学习了,变得和大专中专高中生一样了,为什么还会值钱?
2019-08-05 17:08:23 +08:00
回复了 hlwjia 创建的主题 分享创造 工程师装逼神器👨‍💻 - 命令行查单词工具
@635614874 就是个 pdf 阅读器。我只是建议楼主想一下有什么方法能够优化查询方式显示方式,因为这种 陌生单词->切换->输入单词->显示单词意思->切回原来的程序 这样的效率很低而且容易打断阅读思路。
(当然这些完全是以一个使用者角度看的,你就当是一个类似产品经理提出来的手机主题根据手机壳自动变色的建议吧手动斜眼。)
2019-08-05 16:35:37 +08:00
回复了 hlwjia 创建的主题 分享创造 工程师装逼神器👨‍💻 - 命令行查单词工具
目前用过最舒服的查单词,是 mac 下的 skim,右键查找单词无缝衔接 mac 内置词典,弹出一个框显示单词意思,随便在别的地方点一下方框就消失。感觉阅读时候,最烦的是被打断,因此专门切换到单词软件 /terminal 是一件很难受的事情。
所以我觉得你可以往这个方向研究一下,查单词好说,但是如何能在不影响机器性能(例如全局监控鼠标动作键盘动作剪切板等等这种)的情况下不打断阅读流畅性地显示单词意思,这才是最重要的
2019-08-05 14:20:25 +08:00
回复了 dajj 创建的主题 YouTube youtube 上有什么优秀频道推荐
matt jones
sampilgram
少康战情室
骑车没用别买了。我们有很多胖子车手,而且我们每周的强度真的是大的一批(平均每次来回 50 公里马路
+20 公里越野爬坡),然而依旧很胖。
其实很不理解。。数据仓库就是数据仓库,挖掘就是挖掘,nlp 就是 nlp。为什么数仓工程师非要人家懂机器学习算法懂自然语言处理?到底是要招的什么岗位?这么说吧,市场均价来说 hadoop 开发 20 万,etl 仓库 20 万,nlp30 万,你这又要人家懂 hadoop 又要懂 etl 又要懂 nlp 又要懂 web,你能给多少钱
好像 cv 岗位挺多的。但是之前关注的一个厦大某同学运营的 nlp 公众号里说图像识别最终还是需要 nlp 做内容分析,nlp 更有前景
2019-07-26 15:46:00 +08:00
回复了 BBrother 创建的主题 问与答 最近入门神经网络,遇到个问题想请教一下
@wqzjk393 10 个神经元分布代表 1 到 10,用 0 和 1 代表是不是这一个分类。
这个说的可能有点问题。。10 个神经元分布代表 0 到 9,用使用这 10 个输出里面最大的的那一个结果作为最后的预测分类。如果你采用 9 个神经元的话,可以定义一个 threshold 值,如果 9 个输出都小于这个值,那么就认为是最后那个分类。
2019-07-26 15:41:56 +08:00
回复了 BBrother 创建的主题 问与答 最近入门神经网络,遇到个问题想请教一下
多输入一输出,理论上是能分割两种类别,一个是输入的加权和通过激活函数以后的值 a,另一个则是 1-a,那么判断 a 和 1-a 的大小就可以定义分到哪一类了(这个激活函数如果不用 sigmoid,改用 softmax,那基本上就可以完全理解成输出为某一类的概率了,然后 1-a 就是另外一类的概率了)。
如果你往后继续看的话,就会看到使用 mnist 数据集做手写识别的时候,一般设计最后一层是 10 个神经元分布代表 1 到 10,用 0 和 1 代表是不是这一个分类。当然如果你要想定义 9 个神经元也没问题,就是全 0 的输出的时候定义为某个特定的值罢了,这只是神经网络结构设计上个人选择而已。类似 python 里面的 df.get_dummies,就是删掉一个输出结果,用其他的输出结果组合(例如全零)来表示这个删掉的
2019-07-26 13:54:42 +08:00
回复了 RBQMT 创建的主题 DevOps CCNA,CCNP 含金量高么,打算选择运维行业
看你是刷题还是看书拿到的证书了。TCP/IP 详解卷 123 看完拿到证书和刷完题库拿到证书,水平明细是不一样的。当年我专业课各种挂科的舍友刷题库拿了 ccna,九百五十还是多少分来的。。。
2019-07-26 10:08:49 +08:00
回复了 noah1987 创建的主题 问与答 有熟悉 Email 推广的么?请教几个问题
朴素贝叶斯一个最重要的应用场景就是垃圾邮件分类,现在几乎所有邮箱都有应用的。你先考虑下你们的邮件能不能逃过 spam 再说调研吧。。
高音唱不上去这没啥好办法,需要长时间训练才行。
音准不行的话,可以跟着钢琴唱音阶 123454321 这样的,虽然不会说准确到专业歌手那样,但是几周下来音准对于 ktv 来说绝对够用了
2019-07-25 16:32:29 +08:00
回复了 vanityfairn 创建的主题 职场话题 [转载] :谁在午休,立刻走人
顺便去看准网拉勾网脉脉看看评论 23333
2019-07-25 15:01:34 +08:00
回复了 alsonj 创建的主题 奇思妙想 想做个匿名社区有感兴趣的吗
类似看准网的公司评价面试评价这种,注册用户、未注册游客用户只能看到别人的发言、头像和昵称,但是无法点进去查看个人注册信息
2019-07-25 13:58:04 +08:00
回复了 ClassHacker 创建的主题 问与答 宇宙的外边是什么?
外面应该是一个超过 3 维的空间吧
“我觉得看到很多人的回复,让我想到一句话:后宫不得干政治……哈哈,看样子很多公司的技术部就是公司的后宫啊!实在想不到这么多人年纪轻轻就如此的迂腐!”

迂腐?如果项目出了差错你能站出来帮手下人背锅,如果程序员被产品怼你能记得站出来,你看看还迂腐不?让手下人改东西,手下人不肯还怪人家怕背锅?工资是你发的还是老板发的?出了差错你能一句话让老板留下背锅的程序员?你看你说的这样,估计一旦产品出现问题,你肯定第一时间表示跟自己无关
1 ... 12  13  14  15  16  17  18  19  20  21 ... 33  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3878 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 38ms · UTC 04:10 · PVG 12:10 · LAX 21:10 · JFK 00:10
Developed with CodeLauncher
♥ Do have faith in what you're doing.