Overview
Go 语言的源码文件分为三类:命令源码、库源码、测试源码。
命令源码文件:是 Go 程序的入口,包含 func main() 函数,且第一行用 package main 声明属于 main 包。
库源码文件:主要是各种函数、接口等,例如工具类的函数。
测试源码文件:以 _test.go 为后缀的文件,用于测试程序的功能和性能。
go build 用来编译指定 packages 里的源码文件以及它们的依赖包,编译的时候会到 $GoPath/src/package 路径下寻找源码文件。go build 还可以直接编译指定的源码文件,并且可以同时指定多个。
通过执行 go help build 命令得到 go build 的使用方法:
usage: go build [-o output] [-i] [build flags] [packages]
- o 只能在编译单个包的时候出现,它指定输出的可执行文件的名字。
- i 会安装编译目标所依赖的包,安装是指生成与代码包相对应的 .a 文件,即静态库文件(后面要参与链接),并且放置到当前工作区的 pkg 目录下,且库文件的目录层级和源码层级一致。
build flags 参数,build, clean, get, install, list, run, test 这些命令共用一套:
参数 | 作用 |
---|---|
-a | 强制重新编译所有涉及到的包,包括标准库中的代码包,这会重写 /usr/local/go 目录下的 .a 文件 |
-n | 打印命令执行过程,不真正执行 |
-p n | 指定编译过程中命令执行的并行数,n 默认为 CPU 核数 |
-race | 检测并报告程序中的数据竞争问题 |
-v | 打印命令执行过程中所涉及到的代码包名称 |
-x | 打印命令执行过程中所涉及到的命令,并执行 |
-work | 打印编译过程中的临时文件夹。通常情况下,编译完成后会被删除 |
-C dir | 在运行命令前转到路径dir下,对命令中的所有文件均有效 |
Issues in go build
这里可以把go和C的编译过程类比,如果只有一个main文件则可以直接:
go build -o binfile main.go
但是如果main中引用了其他同目录下,同package中的一些暴露的对象和方法,则需要:
go build -o binfile main.go ref1.go ref2.go ...
或者更普适的:
go build .
需要注意的是,go test可以直接跑,不需要把依赖的包全部写上,go build 会忽略 *_test.go 文件。
go get & go install
go get 和 go install 是 Go 语言中用于获取和安装包的命令,它们之间有以下区别:
- 功能:go get 用于获取(下载)远程代码仓库或更新已有的代码仓库,它会自动解析并下载依赖的包。而 go install 用于将代码包编译并安装到指定位置,将生成的可执行文件或库文件安装到 $GOPATH/bin 或 $GOPATH/pkg 目录下。
- 使用方式:go get 后面通常跟着一个包的导入路径,它会下载并安装该包及其依赖。例如:go get github.com/example/package。而 go install 后面通常跟着一个包的相对路径或绝对路径,它会编译并安装指定的包。例如:go install ./path/to/package。
- 安装位置:go get 下载的包会被存放在 $GOPATH/src 目录下,而 go install 会将编译生成的可执行文件或库文件安装到 $GOPATH/bin 或 $GOPATH/pkg 目录下。
- 版本控制:go get 可以根据包的版本控制信息(如 Git 标签、GitHub Releases 等)下载指定版本的包。而 go install 则不涉及版本控制,它是根据当前代码的状态进行编译安装。
总结来说,go get 主要用于获取和更新包及其依赖,go install 主要用于编译并安装代码包到指定位置。
GOPATH
指定多个 GOPATH 的方法有两种:
- 使用环境变量:可以通过设置多个 GOPATH 环境变量来指定多个工作空间。每个 GOPATH 的值应该是不同的目录路径,多个路径之间使用操作系统特定的路径分隔符(如 Windows 上的分号 ;,Unix/Linux 上的冒号 :)进行分隔。例如,在 Linux 上可以这样设置两个 GOPATH:
export GOPATH=/path/to/gopath1:/path/to/gopath2
- 使用 Go Modules:如果你的项目使用了 Go Modules(Go 1.11+ 版本),可以在项目的根目录下创建一个 go.mod 文件,并使用 go mod init 命令初始化模块。在 Go Modules 中,不再需要设置 GOPATH,而是直接在项目目录中管理依赖和版本。每个项目可以独立指定依赖的版本,并且不会受到全局 GOPATH 的影响。使用这种方法,go get/ go install 的内容会保存在当前模块的bin目录下。
Debug
就用gdb!
i files 列出文件和 Entry point
开始你的表演
Asm
单纯的go汇编
go build -gcflags=-S main.go 1> main.S 2>&1
完整的编译过程
go build -x -work main.go 1> transcript.txt 2>&1
在命令行中,2>&1 中的 & 是用来表示文件描述符的标识符。在这种上下文中,1 表示标准输出(stdout),2 表示标准错误输出(stderr)。
使用 2>&1 的语法可以将标准错误输出重定向到与标准输出相同的目标。具体来说,2>&1 表示将文件描述符 2(标准错误输出)重定向到文件描述符 1(标准输出),也就是将标准错误输出合并到标准输出中。
更详细的指令
- 先使用 go build -gcflags “-N -l” main.go 生成对应的可执行二进制文件 再使用 go tool objdump -s “main.” main 反编译获取对应的汇编
- 使用 go tool compile -S -N -l main.go 这种方式直接输出汇编
- 使用go build -gcflags=“-N -l -S” main.go 直接输出汇编
-l 禁止内联
-N 编译时,禁止优化
-S 输出汇编代码
-s “target” 只输出匹配target的汇编
Go bootstrap
- 检查运行平台的CPU,设置好程序运行需要相关标志。
- TLS的初始化。
- runtime.args、runtime.osinit、runtime.schedinit 三个方法做好程序运行需要的各种变量与调度器。
- runtime.newproc创建新的goroutine用于绑定用户写的main方法。
- runtime.mstart开始goroutine的调度。
最后用一张图来总结 go bootstrap 过程吧:
main 函数里执行的一些重要的操作包括:新建一个线程执行 sysmon 函数,定期垃圾回收和调度抢占;启动 gc;执行所有的 init 函数等等。
上面是启动过程,看一下退出过程:
当 main 函数执行结束之后,会执行 exit(0) 来退出进程。若执行 exit(0) 后,进程没有退出,main 函数最后的代码会一直访问非法地址:
exit(0)
for {
var x *int32
*x = 0
}
正常情况下,一旦出现非法地址访问,系统会把进程杀死,用这样的方法确保进程退出。
关于程序退出这一段的阐述来自群聊《golang runtime 阅读》,又是一个高阶的读源码的组织,github 主页见参考资料。
当然 Go 程序启动这一部分其实还会涉及到 fork 一个新进程、装载可执行文件,控制权转移等问题。还是推荐看前面的两本书,我觉得我不会写得更好,就不叙述了。