Linux | 我的站点

Void Linux 初体验

最近要做一些Linux kernel相关的测试工作，为了避免影响到其它同事，决定使用虚拟机。过去的3年一直使用Arch Linux，有点烦了，所以打算尝试一个新的发行版（前提必须也是“滚动发行”（rolling-release）的），这次我选择了Void Linux。

Void Linux吸引我的地方在于它的“特立独行”：

（1）没有使用现在主流的systemd，而是用runit来作为初始化系统，这更接近传统的Unix方式；

（2）使用OpenBSD团队开发的LibreSSL而不是OpenSSL。

另外，Void Linux与Arch Linux的一个重要区别在于内核的版本：Arch Linux选择stable版本（现在是5.1.5），而Void Linux则是long-term（4.19.46）。

经过一周的使用，总体来说Void Linux感觉不错，能够满足我的开发需求。感兴趣的朋友也可以尝试一下。

如何实现一个Linux性能监控工具

Nmon是Linux系统下一个简单但强大的性能监控工具。在新年的头一个月里，我花时间阅读了nmon的代码，总结了如何实现一个简单的Linux性能监控工具：

（1）获取性能数据。/proc文件系统是个宝库，你想要的信息几乎都可以从这里得到：
a）CPU利用率：/proc/stat；
b）内存利用率：/proc/meminfo和/proc/vmstat；
c）磁盘利用率：/proc/diskstats；
d）网络利用率：/proc/net/dev；
e）单独进程的状态：/proc/[pid]目录；
f）其余感兴趣的信息：比如关于系统的负载状况，可以读取/proc/loadavg。

（2）理解和解析数据。参考man手册，了解每一项数据的含义，必要时候可以阅读内核代码和学习相关的硬件知识。

（3）展示数据。Nmon使用的是“原始”的ncurses库，当然也可以使用“现代化”的GUI工具以达到更好的用户体验。

如果想进一步了解nmon内部的原理，也可参考我写的这本剖析nmon代码的小册子。

使用uptime命令检查Unix系统的负载状况

Unix系统的uptime命令可以用来检查系统的负载状况。以Linux为例：

$ uptime
 01:32:50 up 40 days,  3:09, 56 users,  load average: 11.72, 11.67, 11.51

load average后面的3个值分别是系统在过去1，5和15分钟负载的平均值（这里的负载包含3种进程：当前正在被CPU执行的，一切条件就绪等待CPU调度的，和等待磁盘读取结果的）。衡量当前系统是否“过载”，需要把load average同CPU的数量结合起来考虑。如果load average的值是1，并且当前系统上只有一个CPU（需要注意，这里的CPU指一个“逻辑CPU”，即需要考虑物理CPU有多个core，每个core支持hyper-thread的情况），那么系统在过去的时间就是“满负荷”运转的。但是如果系统上有4个CPU，那么系统就只有1 / 4 = 25%的时间是忙碌的，其余75%是空闲的。

Linux系统的uptime读取/proc/loadavg文件：

$ cat /proc/loadavg
12.97 11.53 11.33 12/3958 7094

前三项对应uptime中load average的输出。第四项中斜线前面的是活跃的kernel进程（线程）数，后面则是系统所有的kernel进程（线程）数。最后一项是系统最新产生的进程ID。

对于OpenBSD来说，由于其没有/proc文件系统。它的uptime实现则是通过sysctl系统调用读取vm.loadavg的值。

Linux Journal停刊了，BSD magazine还在继续。。。

在2017年最后一个月里，发生了两件事：

（1）12月1日，从1994年创刊的Linux Journal杂志宣布停刊了（参考Linux Journal Ceases Publication），这本历史最悠久的Linux杂志正式退出了历史舞台。我个人觉得很是惋惜，有时搜索一些信息时，经常可以搜到Linux Journal的文章，虽然年代有些久远，但是内容依旧适用。

（2）昨天，也就是12月31日，BSD Magazine发布了第100期。这个去年一度要停办的杂志，还是坚持了下来，我也希望它越办越好。我很喜欢每期里关于采访程序员的栏目，这可以让我了解其他国家软件工程师的日常生活和工作经历。此外，每期也会有一些当前的热点内容，比如这一期就介绍了比特币的背景和在FreeBSD上如何安装bitcoind程序。BSD Magazine是免费的，因此如果你对BSD感兴趣，可以考虑订阅一下。一分钱不花，学到新知识，何乐而不为？

Arch Linux —— 一个不错的Linux发行版

使用Arch Linux差不多有一年的时间了，总体感觉它是一个很不错的Linux发行版。

Arch Linux采用的是“滚动发布”（rolling release）模式，只需一个“pacman -Syu”命令，就可以用上最新的内核和软件包。这对那些对软件版本“追求极致”的开发者们（比如我），无疑是个“福音”。此外，Arch Linux的安装包做的很“人性化”。例如，我最近尝试使用clang开发OpenMP程序，不同于gcc，clang需要安装额外的包。而在安装clang时，系统会给出详细的提示信息：

# pacman -S clang
......
Optional dependencies for clang
    openmp: OpenMP support in clang with -fopenmp
    python2: for scan-view and git-clang-format
......

可以看到，除了表明需要openmp安装包外，系统还指出使用clang时要使用-fopenmp选项，这充分反映了安装包“考虑”的很“周全”。而在使用其它的一些Linux发行版时，安装clang的OpenMP开发包时就很费一番周折。

另外，Arch Linux已经正式宣布不再支持i686平台了，这也提醒我们，也许是时候考虑和32位处理器说再见了。

如何计算进程占用的物理内存

How to get the process resident set size一文不仅介绍了在Windows和Unix（包括Linux，BSD，macOS等等）操作系统上如何获取进程所使用的峰值和实时物理内存，并提供了现成的代码。在这里我只分析一下Linux上相关功能的实现：

（1）获取峰值内存：

size_t getPeakRSS() {
    struct rusage rusage;
    getrusage(RUSAGE_SELF, &rusage);
    return (size_t)(rusage.ru_maxrss * 1024L);
}

getrusage函数获取进程资源的使用情况。当第一个参数时RUSAGE_SELF时，表示得到当前进程的统计数据。struct rusage中的ru_maxrss即表示该进程物理内存的使用峰值，因为度量单位是kilobytes，故而需要乘以1024。

（2）获得实时内存：

size_t getCurrentRSS() {
    long rss = 0L;
    FILE* fp = NULL;
    if ( (fp = fopen( "/proc/self/statm", "r" )) == NULL )
        return (size_t)0L;      /* Can't open? */
    if ( fscanf( fp, "%*s%ld", &rss ) != 1 )
    {
        fclose( fp );
        return (size_t)0L;      /* Can't read? */
    }
    fclose( fp );
    return (size_t)rss * (size_t)sysconf( _SC_PAGESIZE);
}

/proc/self/statm文件共包含7个字段，第二个即是进程当前时刻占用的物理内存，单位是页面大小。要获得精确的字节数，还需通过sysconf系统调用获得页面所占据的空间，通常为4096。

Linux垄断超级计算机

top500网站公布的统计数据显示，目前世界排名前500的超级计算机使用的全部都是Linux操作系统：
这就意味着之前“500强”中仅存的2台Unix也终于“沦陷”了：

看一下关于Linux发行版的统计数据：

占据份额最大的是“Linux”，是因为不能确定具体的发行版？还是自己组装的，所以不属于任何发行版？我没有找到解释。但是“屈居亚军”的是CentOS，这倒也反映了这个RHEL的“免费社区版本”的稳定性以及受欢迎程度。如果你想选一个不花钱，又可靠的操作系统，CentOS可能是一个不错的选择。

此外，中国的超级计算机数量首次超越美国，成为世界第一：

最后，我的前东家HPE在生产厂商的排名中继续高居榜首，联想和浪潮，这两个来自中国的企业紧随其后：

Perf笔记（七）——perf trace

perf trace有类似于strace功能，可以实时监控程序的系统调用：

# perf trace ./a.out
 0.032 ( 0.002 ms): a.out/7673 brk(                                                                  ) = 0x1e6b000
 0.051 ( 0.005 ms): a.out/7673 access(filename: 0xb7c1cb00, mode: R                                  ) = -1 ENOENT No such file or directory
 0.063 ( 0.005 ms): a.out/7673 open(filename: 0xb7c1a7b7, flags: CLOEXEC                             ) = 3
 0.070 ( 0.002 ms): a.out/7673 fstat(fd: 3, statbuf: 0x7ffffb72bc80                                  ) = 0
 0.073 ( 0.004 ms): a.out/7673 mmap(len: 38436, prot: READ, flags: PRIVATE, fd: 3                    ) = 0x7f18b7e15000
 0.079 ( 0.001 ms): a.out/7673 close(fd: 3                                                           ) = 0
 0.087 ( 0.005 ms): a.out/7673 open(filename: 0xb7e21ec0, flags: CLOEXEC                             ) = 3
 0.093 ( 0.003 ms): a.out/7673 read(fd: 3, buf: 0x7ffffb72be28, count: 832                           ) = 832
 0.099 ( 0.002 ms): a.out/7673 fstat(fd: 3, statbuf: 0x7ffffb72bcc0                                  ) = 0
 0.102 ( 0.003 ms): a.out/7673 mmap(len: 8192, prot: READ|WRITE, flags: PRIVATE|ANONYMOUS, fd: -1    ) = 0x7f18b7e13000
 0.110 ( 0.004 ms): a.out/7673 mmap(len: 2283024, prot: EXEC|READ, flags: PRIVATE|DENYWRITE, fd: 3   ) = 0x7f18b79cf000
 0.116 ( 0.007 ms): a.out/7673 mprotect(start: 0x7f18b79fc000, len: 2093056                          ) = 0
 0.125 ( 0.005 ms): a.out/7673 mmap(addr: 0x7f18b7bfb000, len: 8192, prot: READ|WRITE, flags: PRIVATE|DENYWRITE|FIXED, fd: 3, off: 180224) = 0x7f18b7bfb000
 0.142 ( 0.002 ms): a.out/7673 close(fd: 3                                                           ) = 0
 0.153 ( 0.006 ms): a.out/7673 open(filename: 0xb7e134c0, flags: CLOEXEC                             ) = 3
 0.161 ( 0.003 ms): a.out/7673 read(fd: 3, buf: 0x7ffffb72bdf8, count: 832                           ) = 832
 0.165 ( 0.002 ms): a.out/7673 fstat(fd: 3, statbuf: 0x7ffffb72bc90                                  ) = 0
 0.169 ( 0.005 ms): a.out/7673 mmap(len: 2216432, prot: EXEC|READ, flags: PRIVATE|DENYWRITE, fd: 3   ) = 0x7f18b77b1000
......

Perf笔记（六）——编译和使用最新版本的perf

Acme是Linux perf的maintainer，他的perf/core分支包含了perf工具的最新功能。所以如果想体验最新版本的perf，可以下载和编译Acme的perf：

git clone git://git.kernel.org/pub/scm/linux/kernel/git/acme/linux -b perf/core
cd linux/tools/perf
make

Perf笔记（五）——显示具体函数的profiling信息

在使用perf report命令显示profiling的结果时：

按a可以显示当前函数的profiling信息以及汇编指令：

2024年4月
一	二	三	四	五	六	日
« 12月
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30