文科生坐拥 20 台高配服务器,该怎么好好利用?

2020-01-13 21:14:05 +08:00
 leoballacl

有点标题党了,事实是这样的,我正在某学校文科学院担任研究助理。大数据的火热让不少文科专业也开始跟风,我所在的实验室的设备确实给力,20 台服务器,每台服务器有 256G 内存,4T 固态硬盘存储。

然而管实验室的老师是文科出生,Linux,Python, Spark, Hadoop 等都只是了解功能,技术细节并不懂。我们实验室之前有另外一名专职的科研助理,他统计学背景的,爬虫做得不错,服务器在跑的几个爬虫任务都是他一手搭建的。不过最近他离职了(毕竟 IT 公司给的薪资比学校高多了),爬虫的任务时不时出现问题还要找他远程帮忙解决。

前段时间我们的服务器被学校的网络中心检测到有僵尸网络入侵,我们找供应商帮忙看是什么原因。搞了半天最后也只能“治标不治本”地进行 IP 封锁而已。

杂七杂八地说那么多,我也不知道我想说什么,我只是觉得好暴殄天物啊,200 万的机器,监测环境没有,用户管理一团糟。数据分析现在我们用单机就能暂时解决了,分布式系统都没怎么利用。

我好愧疚啊,毕竟这些机器都是国家掏的钱,并不能做到物尽其用。听说今年还有一百万的经费下来,要购置一批 GPU 服务器。

各位 V 友对我有什么建议吗?我也是纯文科生,熟练使用 R 语言,Python 入门。我应该怎样做才能提高这些服务器的利用效果,例如我们的服务器需要装什么东西好让服务器运转地更合理科学?我应该努力学习哪些方面的知识?多说一句,我的研究方向是计算社会科学。

我现在用着实验室内存 500G,价格 20 万的工作站发帖,感觉硬件条件好到让我这小白好惭愧。

10335 次点击
所在节点    服务器
51 条回复
leoballacl
2020-01-13 22:39:01 +08:00
@WinG 我还以为是什么技术。。。。违法的事情我不做
baobao1270
2020-01-13 22:49:32 +08:00
搞不懂,文学院为啥要弄这么高端的服务器?
文学……和大数据?似乎没什么好搞的,如果楼主发现了可以搞的点,说不定能发现一个新兴市场呢

可以尝试方向:
人工智能翻译?(似乎抢外国语学院的活了
金融数据分析?(似乎抢商学院的活了,但是我学校的商学院是文学院分出去的……
人工智能文学创作、语义识别……等等
人工智能舆情分析?(希望别搞出来吧……
leoballacl
2020-01-13 23:10:49 +08:00
@baobao1270 层主应该是硬核理工科学生了。事实上,文科里面也有不少搞大数据和机器学习的。我是传媒相关专业的,对媒体文本数据进行挖掘、自然语言处理是我们的日常任务(尽管还远说不上熟练)。另外,已经有一些知名的传媒学院在搞舆情检测系统给 zf 服务了。。。。
lekai63
2020-01-13 23:31:48 +08:00
文言文编程 比较适合楼主
可以和本站那个谁,基于学术研究合作下,顺便还为开源世界贡献了一定的算力
lekai63
2020-01-13 23:35:44 +08:00
这个东东有新意 而且开源项目算小有成果了。
跟原作者 合计合计优化下语法,拓展下,或者搞点类库,试试自举啥的。
ProfFan
2020-01-13 23:38:03 +08:00
楼主是 Tech 的嘛?维护可以找 CS 的本科生嘛,补助一个月给个 6K 就行了,可以帮你介绍啊(
after1990s
2020-01-13 23:45:19 +08:00
要是想捐助学术项目的话,BONIC 上有很多,什么寻找外星人,抗击癌症,清洁能源之类的。
askfermi
2020-01-13 23:52:27 +08:00
@leoballacl 前段时间搞了一个 GitHub 多样性和代码质量的关系,需要分析很多仓库的代码质量,也许可以一起搞 :)
dremy
2020-01-13 23:57:41 +08:00
暴殄天物……
话说学校如果没谁主动申请的话,这些服务器应该不会硬送吧,又不是中小学生上课用的 PC…
话说这一台服务器能换多少台学生机哟喂
ronman
2020-01-14 00:03:38 +08:00
BOINC 了解一下,为人类文明建设做贡献
Tn5ohB1Yecdk3qCK
2020-01-14 00:05:42 +08:00
挖坑+1
love
2020-01-14 00:18:32 +08:00
不是自己的钱浪费起来不心疼
noqwerty
2020-01-14 00:31:46 +08:00
羡慕+1,我们实验室服务器的配置大概只有你们的十分之一。那么你们实验室当时采购这些服务器的用途是什么呢?老板也没有任何课题研究方向就花了这么多钱?
chinesestudio
2020-01-14 00:54:48 +08:00
要不发点工资给我 我给你们上 proxmox 集群 网页管理服务器方便的很。
WittBulter
2020-01-14 01:14:12 +08:00
用 20 万的工作站发帖可还行....
按 lz 说的文学院的水平,很难发挥这些机器的价值,毕竟按目前状态能搞的研究课题估计一个工作站都绰绰有余。可以在一部分机器上装一些管理系统日常用来跑算法,或是集群微服务的部署,给同校其他学院的人或是开源使用。不过按 lz 爬虫都难以维护的状态,想要运维这些也太难了...
AES256GCM
2020-01-14 01:21:32 +08:00
光说了内存和硬盘,CPU 和 GPU 的配置还没提呢。最好把配置 print 出来,大家才好参考着给建议。
HTSdTt3WygdgQQGe
2020-01-14 01:28:42 +08:00
不挖矿可惜了
miao666
2020-01-14 03:08:03 +08:00
我的计算是基于业务的,不方便透露给你。目前通过套路云按量付费进行计算,一次三四百吧。
现在 CS 学科贴合业务很重要,很多 CS 重要论文都是在企业里发表。可以找些企业合作下,通过提供算力解决企业技术上的痛点。
祝早日发论文
nlysh007
2020-01-14 03:13:30 +08:00
疑炫无据,不敢言
KasuganoSoras
2020-01-14 03:45:30 +08:00
跑 ESXi 或者 PVE,实在不行 SolusVM,拿来出租 VPS,血赚
前提是有公网 IP,宽带足够

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/637623

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX