MIT 6.S081 Lab1 Xv6 and Unix utilities翻译
Lab1: Xv6 and Unix utilities
实验任务
启动xv6(难度:Easy)
获取实验室的xv6源代码并切换到util分支
1 | $ git clone git://g.csail.mit.edu/xv6-labs-2020 |
Xv6-labs-2020存储库与本书的xv6-riscv稍有不同;它主要添加一些文件。如果你好奇的话,可以执行git log
:
1 | $ git log |
您将需要使用Git版本控制系统管理和提交文件以及后续的实验室作业。接下来,切换到一个分支(执行git checkout util
),其中包含针对该实验室定制的xv6版本。要了解关于Git的更多信息,请查看Git用户手册。Git允许您跟踪对代码所做的更改。例如,如果你完成了其中一个练习,并且想检查你的进度,你可以通过运行以下命令来提交你的变化:
1 | $ git commit -am 'my solution for util lab exercise 1' |
您可以使用git diff
命令跟踪您的更改。运行git diff
将显示自上次提交以来对代码的更改,git diff origin/util
将显示相对于初始xv6-labs-2020代码的更改。这里,***origin/xv6-labs-2020***是git分支的名称,它是包含您下载的初始代码分支。
- 构建并运行xv6
1 | $ make qemu |
如果你在提示符下输入 ls
,你会看到类似如下的输出:
1 | $ ls |
这些是mkfs
在初始文件系统中包含的文件;大多数是可以运行的程序。你刚刚跑了其中一个:ls
。
xv6没有ps
命令,但是如果您键入Ctrl-p,内核将打印每个进程的信息。如果现在尝试,您将看到两行:一行用于init,另一行用于sh。
退出 qemu : Ctrl-a x
。
sleep(难度:Easy)
YOUR JOB
实现xv6的UNIX程序sleep
:您的sleep
应该暂停到用户指定的计时数。一个滴答(tick)是由xv6内核定义的时间概念,即来自定时器芯片的两个中断之间的时间。您的解决方案应该在文件user/sleep.c中
提示:
- 在你开始编码之前,请阅读《book-riscv-rev1》的第一章
- 看看其他的一些程序(如**/user/echo.c, /user/grep.c, /user/rm.c**)查看如何获取传递给程序的命令行参数
- 如果用户忘记传递参数,
sleep
应该打印一条错误信息 - 命令行参数作为字符串传递; 您可以使用
atoi
将其转换为数字(详见**/user/ulib.c**) - 使用系统调用
sleep
- 请参阅kernel/sysproc.c以获取实现
sleep
系统调用的xv6内核代码(查找sys_sleep
),user/user.h提供了sleep
的声明以便其他程序调用,用汇编程序编写的user/usys.S可以帮助sleep
从用户区跳转到内核区。 - 确保
main
函数调用exit()
以退出程序。 - 将你的
sleep
程序添加到Makefile中的UPROGS
中;完成之后,make qemu
将编译您的程序,并且您可以从xv6的shell运行它。 - 看看Kernighan和Ritchie编著的《C程序设计语言》(第二版)来了解C语言。
从xv6 shell运行程序:
1 | $ make qemu |
如果程序在如上所示运行时暂停,则解决方案是正确的。运行make grade
看看你是否真的通过了睡眠测试。
请注意,make grade
运行所有测试,包括下面作业的测试。如果要对一项作业运行成绩测试,请键入(不要启动XV6,在外部终端下使用):
1 | $ ./grade-lab-util sleep |
这将运行与sleep
匹配的成绩测试。或者,您可以键入:
1 | $ make GRADEFLAGS=sleep grade |
效果是一样的。
pingpong(难度:Easy)
YOUR JOB
编写一个使用UNIX系统调用的程序来在两个进程之间“ping-pong”一个字节,请使用两个管道,每个方向一个。父进程应该向子进程发送一个字节;子进程应该打印“<pid>: received ping
”,其中<pid>
是进程ID,并在管道中写入字节发送给父进程,然后退出;父级应该从读取从子进程而来的字节,打印“<pid>: received pong
”,然后退出。您的解决方案应该在文件user/pingpong.c中。
提示:
- 使用
pipe
来创造管道 - 使用
fork
创建子进程 - 使用
read
从管道中读取数据,并且使用write
向管道中写入数据 - 使用
getpid
获取调用进程的pid - 将程序加入到Makefile的
UPROGS
- xv6上的用户程序有一组有限的可用库函数。您可以在user/user.h中看到可调用的程序列表;源代码(系统调用除外)位user/ulib.c、user/printf.c和user/umalloc.c中。
运行程序应得到下面的输出
1 | $ make qemu |
如果您的程序在两个进程之间交换一个字节并产生如上所示的输出,那么您的解决方案是正确的。
Primes(素数,难度:Moderate/Hard)
YOUR JOB
使用管道编写prime sieve
(筛选素数)的并发版本。这个想法是由Unix管道的发明者Doug McIlroy提出的。请查看这个网站(翻译在下面),该网页中间的图片和周围的文字解释了如何做到这一点。您的解决方案应该在/user/primes.c文件中。
您的目标是使用pipe
和fork
来设置管道。第一个进程将数字2到35输入管道。对于每个素数,您将安排创建一个进程,该进程通过一个管道从其左邻居读取数据,并通过另一个管道向其右邻居写入数据。由于xv6的文件描述符和进程数量有限,因此第一个进程可以在35处停止。
提示:
- 请仔细关闭进程不需要的文件描述符,否则您的程序将在第一个进程达到35之前就会导致xv6系统资源不足。
- 一旦第一个进程达到35,它应该使用
wait
等待整个管道终止,包括所有子孙进程等等。因此,主primes
进程应该只在打印完所有输出之后,并且在所有其他primes
进程退出之后退出。 - 提示:当管道的
write
端关闭时,read
返回零。 - 最简单的方法是直接将32位(4字节)int写入管道,而不是使用格式化的ASCII I/O。
- 您应该仅在需要时在管线中创建进程。
- 将程序添加到Makefile中的
UPROGS
如果您的解决方案实现了基于管道的筛选并产生以下输出,则是正确的:
1 | $ make qemu |
参考资料翻译:
考虑所有小于1000的素数的生成。Eratosthenes的筛选法可以通过执行以下伪代码的进程管线来模拟:
1 | p = get a number from left neighbor |
生成进程可以将数字2、3、4、…、1000输入管道的左端:行中的第一个进程消除2的倍数,第二个进程消除3的倍数,第三个进程消除5的倍数,依此类推。
find(难度:Moderate)
YOUR JOB
写一个简化版本的UNIX的find
程序:查找目录树中具有特定名称的所有文件,你的解决方案应该放在user/find.c
提示:
- 查看user/ls.c文件学习如何读取目录
- 使用递归允许
find
下降到子目录中 - 不要在“
.
”和“..
”目录中递归 - 对文件系统的更改会在qemu的运行过程中一直保持;要获得一个干净的文件系统,请运行
make clean
,然后make qemu
- 你将会使用到C语言的字符串,要学习它请看《C程序设计语言》(K&R),例如第5.5节
- 注意在C语言中不能像python一样使用“
==
”对字符串进行比较,而应当使用strcmp()
- 将程序加入到Makefile的
UPROGS
如果你的程序输出下面的内容,那么它是正确的(当文件系统中包含文件b和a/b的时候)
1 | $ make qemu |
xargs(难度:Moderate)
YOUR JOB
编写一个简化版UNIX的xargs
程序:它从标准输入中按行读取,并且为每一行执行一个命令,将行作为参数提供给命令。你的解决方案应该在user/xargs.c
下面的例子解释了xargs
的行为
1 | $ echo hello too | xargs echo bye |
注意,这里的命令是echo bye
,额外的参数是hello too
,这样就组成了命令echo bye hello too
,此命令输出bye hello too
请注意,UNIX上的xargs
进行了优化,一次可以向该命令提供更多的参数。 我们不需要您进行此优化。 要使UNIX上的xargs
表现出本实验所实现的方式,请将-n
选项设置为1。例如
1 | $ echo "1\n2" | xargs -n 1 echo line |
提示:
- 使用
fork
和exec
对每行输入调用命令,在父进程中使用wait
等待子进程完成命令。 - 要读取单个输入行,请一次读取一个字符,直到出现换行符(’\n’)。
- kernel/param.h声明
MAXARG
,如果需要声明argv
数组,这可能很有用。 - 将程序添加到Makefile中的
UPROGS
。 - 对文件系统的更改会在qemu的运行过程中保持不变;要获得一个干净的文件系统,请运行
make clean
,然后make qemu
xargs
、find
和grep
结合得很好
1 | $ find . b | xargs grep hello |
将对“.
”下面的目录中名为b的每个文件运行grep hello
。
要测试您的xargs
方案是否正确,请运行shell脚本xargstest.sh。如果您的解决方案产生以下输出,则是正确的:
1 | $ make qemu |
你可能不得不回去修复你的find
程序中的bug。输出有许多$
,因为xv6 shell没有意识到它正在处理来自文件而不是控制台的命令,并为文件中的每个命令打印$
。
提交实验
这就完成了实验。确保你通过了所有的成绩测试。如果这个实验有问题,别忘了把你的答案写在**answers-lab-name.txt中。**提交你的更改(包括answers-lab-name.txt),然后在实验目录中键入make handin
以提交实验。
花费的时间
创建一个命名为time.txt的新文件,并在其中输入一个整数,即您在实验室花费的小时数。不要忘记git add
和git commit
文件。
提交
你将使用**提交网站**提交作业。您需要从提交网站请求一次API密钥,然后才能提交任何作业或实验。
将最终更改提交到实验后,键入make handin
以提交实验。
1 | $ git commit -am "ready to submit my lab" |
make handin
将把你的API密钥存储在myapi.key中。如果需要更改API密钥,只需删除此文件并让make handin
再次生成它(myapi.key不得包含换行符)。
如果你运行了make handin
,并且你有未提交的更改或未跟踪的文件,则会看到类似于以下内容的输出:
1 | M hello.c |
检查上述行,确保跟踪了您的实验解决方案所需的所有文件,即以??开头的行中所显示的文件。您可以使用git add filename
命令使git追踪创建的新文件。
如果make handin
无法正常工作,请尝试使用curl或Git命令修复该问题。或者你可以运行make tarball
。这将为您制作一个tar文件,然后您可以通过我们的web界面上传。
- 请运行“
make grade
”以确保您的代码通过所有测试 - 在运行“
make handin
”之前提交任何修改过的源代码` - 您可以检查提交的状态,并在以下位置下载提交的代码:https://6828.scripts.mit.edu/2020/handin.py/
可选的挑战练习
- 编写一个
uptime
程序,使用uptime
系统调用以滴答为单位打印计算机正常运行时间。(easy) - 在
find
程序的名称匹配中支持正则表达式。grep.c对正则表达式有一些基本的支持。(easy) - xv6 shell(user/sh.c)只是另一个用户程序,您可以对其进行改进。它是一个最小的shell,缺少建立在真实shell中的许多特性。例如,
- 在处理文件中的shell命令时,将shell修改为不打印$(moderate)
- 将shell修改为支持
wait
(easy) - 将shell修改为支持用“
;
”分隔的命令列表(moderate) - 通过实现左括号“
(
” 以及右括号“)
”来修改shell以支持子shell(moderate) - 将shell修改为支持
tab
键补全(easy) - 修改shell使其支持命令历史记录(moderate)
- 或者您希望shell执行的任何其他操作。
- 如果您非常雄心勃勃,可能需要修改内核以支持所需的内核特性;xv6支持的并不多。