有无方法将一份 word 题库转成这种格式的 txt

2022-12-07 14:23:02 +08:00
 StefanShenHSC
word 原文:

275. A 15-year-old girl got pain throat and dry cough for one week, with fever. The high temperature is 38.5 centigrade. Thechest X-ray film showed ground-glass shadow in the middle and lower zones of the right lung. Which kind of antibiotic should be choose
A . macrolide
B . penicillin
C . fluoroquilonone (氟喹诺酮)
D . cephlosporine
E . aminoglycoside (氨基糖苷)
考生答案:
参考答案:A

目标 txt 格式:

A 15-year-old girl got pain throat and dry cough for one week, with fever. The high temperature is 38.5 centigrade. Thechest X-ray film showed ground-glass shadow in the middle and lower zones of the right lung. Which kind of antibiotic should be choose<br>A . macrolide <br>B . penicillin <br>C . fluoroquilonone <br>D . cephlosporine <br>E . aminoglycoside;参考答案:A

i.e. 题目和五个选项用<br>隔开在同一行,参考答案通过";"分割
题库就是很多这种格式的题,想把他转化成这种格式的 txt 导入到 anki 里
题主没太有编程经验,求大神来点详细的教程
763 次点击
所在节点    问与答
11 条回复
imaple
2022-12-07 14:28:55 +08:00
看着用查找->替换就能解决了,文件很大吗?
StefanShenHSC
2022-12-07 14:36:44 +08:00
@imaple 就是有几百道题,一道一道是挨着的,我理解查找-替换的方法是,找换行符号然后替换成<br>,但是两道题之间的换行这样就没了?目标 txt 是每行一道题+答案
StefanShenHSC
2022-12-07 14:37:16 +08:00
@imaple

274. 女性,46 岁。反复胸闷、咳嗽 3 年,再发 1 周。既往体健。查体:T 36.5℃,P 96 次 /分,R 26 次 /分,BP 105/70mmHg 。双肺呼吸音低,未闻及干湿性啰音。最有助于确诊患者“支气管哮喘”的辅助检查结果是
A .痰嗜酸粒细胞增高
B .血嗜酸粒细胞增高
C . FeNO (呼出气冷凝液 NO )增高
D .血 IgE 增高
E . PEF 日间变异率≥20%
考生答案:
参考答案:E
得分:0 分 (此题满分:01 分)

275. A 15-year-old girl got pain throat and dry cough for one week, with fever. The high temperature is 38.5 centigrade. Thechest X-ray film showed ground-glass shadow in the middle and lower zones of the right lung. Which kind of antibiotic should be choose
A . macrolide
B . penicillin
C . fluoroquilonone (氟喹诺酮)
D . cephlosporine
E . aminoglycoside (氨基糖苷)
考生答案:
参考答案:A
得分:0 分 (此题满分:01 分)

文档格式大概是这样
imaple
2022-12-07 14:40:06 +08:00
@StefanShenHSC 看着两道题之间是 2 个换行,另外两道题之间的换行夹带着数字。这些都是可以用来区分题目和选项的换行点
singerll
2022-12-07 14:42:37 +08:00
再把“分)”替换成“分)”+换行,不就行了。或者把“数字.”替换成换行+“数字.”
killva4624
2022-12-07 14:45:06 +08:00
复制到一个 TXT 里,用正则替换就好,我干过类似的事情
题目正文: ^\d{1,}\.(.*)\n 替换成 \1<br>
选项: ^([A-Z] \..*)\n 替换成 \1<br>
不要的行正则去掉: 考生答案.*\n 替换成空
StefanShenHSC
2022-12-07 14:51:09 +08:00
谢谢兄弟们,你们是我的神!

不过遇到了新问题,这里有 A4 型和 B1 型题

A4 型是一个题干跟两~三道题 B1 型是一套答案跟两道题

A4 例子:
637-639 题共用题干:
男,39 岁。剧烈活动时胸部闷痛 4 年。2 天来活动时多次发生短暂意识丧失,数分钟后意识恢复。查体:BP 110/60mmHg ,心界不大,心率 88 次 /分,心律齐,胸骨左缘第四肋间可闻及 3/6 级收缩期喷射性杂音。
637. 该患者最可能的诊断是
A .急性心肌梗死
B .风湿性心脏病
C .肥厚型梗阻性心肌病
D .扩张型心肌病
E .房间隔缺损
考生答案:
参考答案:C
得分:0 分 (此题满分:01 分)
638. [假设信息]该患者 1 天来反复黑矇,伴晕厥 1 次,休息时心电图正常。为进一步明确晕厥的原因,首选的检查是
A .心脏电生理检查
B . Holter
C .脑电图
D .脑 CT
E .超声心动图
考生答案:
参考答案:E
得分:0 分 (此题满分:01 分)
639. 该患者首选的治疗药物是
A .地尔硫䓬
B .美托洛尔
C .培哚普利
D .地高辛
E .华法林

B1 例子:
640-641 题共用备选答案:
A .异烟肼
B .利福平
C .链霉素
D .吡嗪酰胺
E .乙胺丁醇
640. 对于快速生长的结核菌( A 群)作用最强的药物是
考生答案:
参考答案:A
得分:0 分 (此题满分:01 分)
641. 对半休眠但偶尔短期内旺盛生长的结核菌( C 群)最用效的药物是
考生答案:
参考答案:B
得分:0 分 (此题满分:01 分)

这两种好像替换解决不了,哭泣
registerrr
2022-12-07 14:57:49 +08:00
@StefanShenHSC
没什么替换不了的,自己大概摸索一下原理,修改一下正则匹配规则
B1 型题目用 “共用备选答案:” 这几个关键字当锚点
A4 型题目用 “共用题干” 这几个关键字当锚点

一轮不行,多来两轮
StefanShenHSC
2022-12-07 15:35:33 +08:00
@registerrr 好的谢谢!我研究研究
kome
2022-12-07 15:48:19 +08:00
引号内为替换 /被替换内容。
"^pA."替换成"<br>A.",其他选项类似。
"^p 考生答案:"替换成";"。
"^p 参考答案:"替换成参考答案:"参考答案:"。
"考生得分*^p"替换成"^p"。

大概就是上面几个替换,先 word 复制出来一部分内容试试看,确定没问题了就全部替换,大不了最后审查一遍。
这类文档规律性很强,找找固定格式,配合 word 通配符批量替换就是了。
StefanShenHSC
2022-12-09 14:03:49 +08:00
update 一下,我找到了 B1 A4 题如何把每道大题的题目和答案分别聚集在一起的方法,可以找到锚点之后替换成英文逗号,然后转成 ansi 编码的 csv 文件,就可以在 excel 里直接更改顺序啦!改完了再转成 utf-8 就行

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/900782

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX