---
title: "TTY 中的回车和换行"
date: 2023-08-29T16:48:34+08:00
tags: []
categories: []
weight: 50
show_comments: true
draft: false
description: "在 TTY 中,输入时 <CR> 会转换为 <LF>,输出时 <LF> 会转换为 <CR><LF>"
---

常说 Linux 下换行符为 `<LF>` 而 Windows 下换行符为 `<CR><LF>`,即便是 Linux 下,TTY 也有对于换行符的额外处理。

<!--more-->

在上个世纪,TTY 所模拟的物理终端,其原型打字机,是真的有回车和换行两个按键的,所以在 TTY 输出时,即便本应使用 `<LF>` 作为换行符,也为了模拟打字机的逻辑,将换行符输出为 `<CR><LF>`。回车和换行的行为可以简单总结为以下。

|  | `<CR>` | `<LF>` |
|:---:|:---:|:---:|
| 常用转义表示 | `\r` | `\n` |
| 常用名称 | Carriage Return / 回车 | Newline / Linefeed / 换行 |
| ASCII 序号 | 0x0D | 0x0A |
| 其他输入方式 | Ctrl + M | Ctrl + J |

对于 `<CR>` 的输入,使用键盘的 Enter 键即可,也可以使用 Ctrl + M 输入,但是对于 `<LF>` ,由于键盘上不再有这个键,所以只能使用 Ctrl + J 输入。

Linux Kernal 的 Terminal Driver 工作在 canonical(也叫 cooked)模式下,**此模式会在输入时将 `<CR>` 转换为 `<LF>`,在输出时将 `<LF>` 转换为 `<CR><LF>` 。**

## 感受这个现象

首先创建一个交互式程序 interactive.sh ,它只询问谁在这里,并打一个招呼:

```bash
#!/usr/bin/env bash
# with name interactive.sh

echo "Who's here?"
echo -n "> "
read name

echo "Oh hello, $name"
```

然后创建一个 expect 脚本 interactive.exp,用来代替人工和刚刚的交互式程序进行交互,它会启动该交互程序,并在交互式程序输出“Who's here”的时候输入“Normal User\n”,最后在交互式程序退出时结束:

```
#!/usr/bin/expect -f

# exp_internal 1        # Uncomment this for debug output
spawn "./interactive.sh"

expect {
    "Who's here?\r" {               # Must end with "\r" or "\r\n" or neither
        exp_send "Normal User\n" ;  # Can end with either "\r" or "\n"
        exp_continue;
    }
    eof
}
```

在 expect 脚本中,在期望“Who's here?”的输出时,如果要匹配换行符,则需要使用 `\r` 或 `\r\n` 来匹配部分或全部换行符,如果启用 interactive.exp 中的 debug 输出,你将能够看到下面这样一行,进而得知实际进行匹配的文本是 `Who's here?\r\n> `,对于这个换行符为 `\r\n` 的文本自然也只能用 `\r` 或 `\r\n` 来匹配。

```
expect: does "Who's here?\r\n> " (spawn_id exp4) match glob pattern "Who's here?\r"? yes
```

### TTY 转换换行符在 interactive.exp 中的体现

匹配 interactive.sh 的输出时,反直觉的一点就是不能够使用 `\n` 来匹配换行符,推测是因为 expect 虚拟化了一个终端但是没有进行针对换行符的处理,再加上 TTY 在输出时将 `\n` 转换为 `\r\n`(interactive.sh 输出的换行符是 `\n`,这里不再详细考证),于是 expect 就接收到了 `\r\n`,在脚本中也只能使用 `\r\n` 来匹配。

而在向 interactive.sh 提供输入内容时,换行符的输入可以任意使用 `\r` 或 `\n`,是因为 TTY 在输入时将 `\r` 转换为 `\n`,所以无论如何最后输入给程序的一定是 `\n`,再加上 bash 的 `read` 的默的 dlimiter 是 `$IFS` 即 ` \t\n`(空格、制表、换行),所以能够被 read 正确识别到 `\n` 作为终止符,进而读取到 `Normal User` 的字符串。

## 参考

1. <https://stackoverflow.com/questions/26187170/difference-between-n-and-r-in-expect>
2. <https://superuser.com/questions/714078/wrong-newline-character-over-serial-port-cr-instead-of-lf>
3. <https://en.wikipedia.org/wiki/Newline>
4. <https://en.wikipedia.org/wiki/Carriage_return>