1 背景
远端文件拉取到本地后,会根据本地机器的操作系统、或文件编辑器,修改文件内容的行尾。例如远端代码为适配其代码托管的宿主、存储服务器与编译构建环境,通常采用 LF 作为行尾,符合 Linux 文件系统习惯。而本地为 Windows 的机器则应在获取文件后将行尾从 LF 转换为 CRLF,适配 Windows 文件系统习惯。在本地做完文件修改进行提交,并准备推送回远端,行尾则应从 CRLF 转换回 LF。而本地为 Linux 的机器则无需对行尾做任何转换,始终以 LF 为行尾。
如何使文件的行尾在合适的环境使用合适的格式
- 避免不合适的格式出现在远端,如以 CRLF 行尾的文件推送至服务器。
- 避免行尾因本地环境的不同,而无法达成统一,在远端被反复来回修改。
- 避免行尾的适配转换被识别为常规的变更,影响其他文件内容变更的跟踪。
- 避免文件行尾格式不正确导致无法在特定系统中被执行,如 *.bat 需要 CRLF 行尾在 Windows 中执行,*.sh 需要 LF 行尾在 Linux 中执行。
这就需要能够自动进行行尾设置的工具来帮忙。恰巧 git / git for windows 内置提供此类设置功能。
2 行尾设置2.1 通用
在仓库的根目录下使用 .gitattributes
文件设置行尾,此设置将直接影响远端对于文件行尾的应用,从而全局的影响所有从远端拉取文件到本地的开发人员。此处需要单独为 *.bat 和 *.sh 设置其在远端存储时所用的行尾,因为这两类文件的行尾设置会直接影响文件是否能够执行,其他文件则不受影响,如 *.cs 即使使用 LF 行尾仍然能够正常的编译构建。
* text=auto*.bat text eol=crlf*.sh text eol=lf
2.2 本地机器为 Windows
每位开发者的本地环境,通过 .gitconfig
文件设置行尾,仅影响的是本地开发环境,需要每位开发者自行配置。可能有其他更为优秀、妥当且不算复杂的方案,可以避免要求每位开发者配置本地环境,但目前对于 Windows 开发者来说,配置本地环境还是最为简单有效的方案。
[core]autocrlf = trueeol = lf
之所以需要设置 core.autocrlf=true
,是因为对于 Windows 用户而言,无论文件创建时是 LF 还是 CRLF,都希望拉取到本地时文件能够适配 Windows 而将 LF 的文件自动转换为 CRLF,当然 *.sh 文件除外。
- 而不设置
core.autocrlf
将影响- 文件行尾及文件的一致性,导致本地变更和工作树、和索引比较时,出现行尾的变更
- 无法保障文件可执行性
- 无法保障文件在本地 Windows 和远端 Linux 能够正常读写,编辑时可能会有编码问题,出现乱码
- 或设置
core.autocrlf=input
所表达的和* text=auto
理论一致,其会在推送远端时将行尾转换为 LF,从远端拉取到本地时会保持文件创建时的原始行尾。造成本身就是 LF 行尾的文件在本地仍然是 LF,不会转换为 CRLF,影响文件在 Windows 系统中的编辑。
之所以要设置 core.eol=lf
,是为了保障仓库内的行尾一致使用 LF,而不是某些文件 LF,某些 CRLF,某些混合。
2.3 本地机器为 Linux / OS X
无需进行 Windows 中所作的配置。
2.4 应用行尾到已经克隆的到本地工作树的仓库
本地工作树可能已经有很多文件出现混合行尾、行尾不正确的情况,此时想要应用新的行尾配置,应当执行行尾变更,推送到远端,并重新克隆。
git add --renormalize .# 提交推送到远端# 将远端仓库重新克隆下来的行尾便全部正常
2.5 查看当前本地工作树内文件的行尾
# 查看所有文件git ls-files --eol# 查找文件行尾中有混合了 LF 和 CRLF 的文件git ls-files --eol | findstr mixedgit ls-files --eol | grep mixed
# i 表示 index,可以视作远端行尾# w 表示 working tree,可以视作本地行尾### 行尾可能的值有 lf、crlf、mixed,mixed 表示一个文件中行尾既有 lf 又有 crlf,应避免 #### attr 表示 .gitattributes 中的行尾设置# 最后一列是文件名称,即当前执行 git ls-files 指令所在目录下的相对路径i/lf w/crlf attr/text=auto .gitattributes
3 行为表现
当正确进行了行尾设置后
- 文件拉取到本地做了行尾转换后,git 并不会认为文件产生了变更,在 git 变更中不会出现新的变更记录。
- 对于做出常规变更的文件,git 在将文件与未修改的版本进行比较时,会将本地文件的行尾自动转换为远端所设置的行尾再进行比对,不会将行尾的变更纳入为实际的变更中来。
行尾的变化对用户来说将变得无感。
4 其他注意事项
单独在 .editorconfig
设置,如所有文件类型或 *.cs 文件类型设置行尾为 CRLF,并不能够影响 git 的行为,仍然无法避免 git 将行尾修改识别为常规变更,并且导致 CRLF 行尾的文件被推送到远端,在远端也能够看到行尾的变更。该设置仅能够为 IDE 如 VS 将在保存文件时检查行尾,将行尾不是 CRLF 的设置为 CRLF。
5 参考资料
- CRLF vs. LF: Normalizing Line Endings in Git
- .gitattributes Best Practices
- merge.renormalize
- Configuring Git to handle line endings
- Git – Difference Between HEAD, Working Tree and Index