怎么通过 VS2019 看 strlen()的源码?

2022-01-01 17:09:22 +08:00
 amiwrong123

vs 工程里,写了这么一句strlen("123");,然后我按住 ctrl ,点 strlen 进去,是这个样子: 如上图,我依次点击 strlen ,_In_z_,_SAL2_Source_,_SA_annotes3 到最后这个_SA_annotes3 这个宏定义,我就懵了,它还有三种宏定义。

而且这个过程,宏定义又包含宏定义的,太复杂了吧,我只是想看一下 strlen 的实现而已。( PS:突然怀念起以前看 java 源码的日子)

所以我这么看源码是对的吗?还是说,我不应该在 VS 里面看 C 的源码阿?(可能以后还想看一下 c++库,比如 vector 的实现)

3877 次点击
所在节点    程序员
22 条回复
x1596357
2022-01-01 17:39:48 +08:00
msvc 的源码是没有公开的。MS 开源了 STL 的部分 https://github.com/microsoft/STL 。strlen 的实现比较简单,类似下面这样。你可以参考 wine 项目的一些 api 实现。
size_t __cdecl strlen( const char *str )
{
const char *s = str;
while (*s) s++;
return s - str;
}
amiwrong123
2022-01-01 17:58:08 +08:00
@x1596357 #1
好吧,我也不是非得通过,msvc 的方式来看源码的。

那问下层主,有没有别的方式,可以方便看 c 或 c++源码的?最好是 能通过 ctrl 点击跳转这种形式。(把 https://github.com/microsoft/STL 下载下来,然后用 sublime 打开,再用一个跳转插件,好像也能实现)

或者说,你们平时看 c 或 c++源码,都是通过什么方式来看的呀?
ipwx
2022-01-01 18:13:12 +08:00
@amiwrong123 CLion (趴桌
iQXQZX
2022-01-01 18:36:33 +08:00
不是给人看的
kokutou
2022-01-01 18:46:09 +08:00
clion 。。。

把 gcc llvm 搞到 Windows 上呗。。。
skinny
2022-01-01 18:50:55 +08:00
C:\Program Files (x86)\Microsoft Visual Studio\2019\Community\VC\Tools\MSVC\14.29.30133\crt\src

去那个目录里面去找,不过不全
amiwrong123
2022-01-01 18:57:49 +08:00
@ipwx #3
@kokutou #5
谢谢,原来是这样的阿😂
ipwx
2022-01-01 19:13:17 +08:00
@amiwrong123 其实 strlen 各家的实现可能都有差别,而且可能会有魔法优化。。。。这种基础库函数反而不容易读代码。比如 gcc 的 strlen:

https://github.com/lattera/glibc/blob/master/string/strlen.c#L33

你看这个实现, /* Instead of the traditional loop which tests each character,
we will test a longword at a time. The tricky part is testing
if *any of the four* bytes in the longword in question are zero. */
ipwx
2022-01-01 19:15:19 +08:00
@amiwrong123 稍微查了查,至少对 vs2008 而言,strlen 是直接用汇编写的,不是 C 代码

First CRT's one is written directly in assembler. you can see it's source code here C:\Program Files\Microsoft Visual Studio 9.0\VC\crt\src\intel\strlen.asm (this is for VS 2008)
msg7086
2022-01-01 19:18:16 +08:00
这种核心函数一般都会优化到裤衩级。
比如楼上贴的深度位运算优化,或者是根据 CPU 型号跑 SSE 或者 AVX 指令集等等。
O3 编译完的汇编代码可能连亲妈都不认识了。
amiwrong123
2022-01-01 19:26:03 +08:00
@ipwx #8
我蒙了,一个 strlen 居然能写的这么复杂,我反正咋一看没看懂咋回事。算了,吃饭去了回头再看。

我只是想看一个 简明的版本罢了
amiwrong123
2022-01-01 19:30:21 +08:00
@ipwx #8
@msg7086 #10
算了,核心函数自己看下原理就行了。

另外,如果想看一眼 C++标准库比如 vector 的实现(比如我可能就想看一下 vector 的拷贝构造函数,看它是怎么构造的),是建议从 vs 里看吗,还是从 clion 里(把 gcc llvm 搞到 Windows 上)?或者其他方式
sujin190
2022-01-01 21:21:46 +08:00
@msg7086 #10 10 楼说的对,这种十分基本的函数会有针对不同平台、不同 cpu 版本、不同指令集的对应汇编级实现,汇编的实现函数会在上层用宏来定义,你找不到具体实现可能是 ide 不能识别汇编函数定义,而且有可能不同版本的汇编函数定义过程是不一样的,很难找的,其实这个函数语义很简单,你不用管不用怀疑具体实现怎么做的吧,真想了解似乎你直接编译后 objdump 看汇编代码更有意义吧
Jooooooooo
2022-01-01 21:39:01 +08:00
(java 如此方便怎么没人夸
LUO12826
2022-01-01 22:02:49 +08:00
你这里看的应该只是头文件(声明),真正的实现源码应该是没有的,已经被编译成二进制库了。这点不像 java ,你点进去 idea 也会给你反编译出来。如果想看这些库函数的实现,可以看 glibc 的源码或者 llvm 的源码( llvm 自己弄了个 libc++,但我不确定它的 libc 搞好没)
rainciousEatDung
2022-01-01 22:05:29 +08:00
“你们平时看 c 或 c++源码,都是通过什么方式来看的呀?”
中二时代:试图搞明白 C 语言的原理,从了解到懵逼。
大学时代:《编译原理》《微机原理》,从上课到挂科。
yolee599
2022-01-01 22:52:48 +08:00
你需要看的是编译器源码,而且不同的编译器实现方法不同,有的编译器是不开源的
ysc3839
2022-01-02 01:01:26 +08:00
@x1596357 msvcrt 和 ucrt 的部分源代码是公开的,注意是公开而不是开源,以前的许可协议不属于开源协议。 @skinny #6 说的是 msvcrt 部分的代码,ucrt 的在 Windows SDK 目录下。
https://github.com/microsoft/STL 是把以前就已经公开 msvcrt 的代码中的 STL 部分换成了开源协议。
至于你说的 点进去的那个只是声明,因为 VS 不知道去哪找源代码,你需要手动打开源代码。_In_z_ 是微软的 SAL 语法,用来描述参数传递的要求的,给代码检查工具用的。
jinliming2
2022-01-02 01:12:59 +08:00
@amiwrong123 #11 一般来说这些你觉得挺简单的函数 /功能,因为要在系统中高频调用,早就被优化的妈都不认了。
我之前看过一篇文章,讲的是 Linux 下的 yes 命令的实现: https://endler.dev/2017/yes/
yes 命令很简单,就是无限循环输出字母 y 。类似于 while (true) { println("y"); }
就这么一个命令,都做了一大堆优化手段,可想而知 strlen 这么“复杂”且在系统中高频使用的函数会需要优化到什么程度……
billwsy
2022-01-02 12:42:00 +08:00
作为用户一般不需要看具体实现,只要看接口是什么就可以了。比如 std::vector ,看这个页面一般就够了: https://en.cppreference.com/w/cpp/container/vector

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/825671

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX