linux-zen-server/Documentation/translations/zh_CN/filesystems/tmpfs.rst

147 lines
6.5 KiB
ReStructuredText
Raw Normal View History

2023-08-30 17:53:23 +02:00
.. SPDX-License-Identifier: GPL-2.0
.. include:: ../disclaimer-zh_CN.rst
:Original: Documentation/filesystems/tmpfs.rst
translated by Wang Qing<wangqing@vivo.com>
=====
Tmpfs
=====
Tmpfs是一个将所有文件都保存在虚拟内存中的文件系统。
tmpfs中的所有内容都是临时的也就是说没有任何文件会在硬盘上创建。
如果卸载tmpfs实例所有保存在其中的文件都会丢失。
tmpfs将所有文件保存在内核缓存中随着文件内容增长或缩小可以将不需要的
页面swap出去。它具有最大限制可以通过“mount -o remount ...”调整。
和ramfs创建tmpfs的模板相比tmpfs包含交换和限制检查。和tmpfs相似的另
一个东西是RAM磁盘/dev/ram*可以在物理RAM中模拟固定大小的硬盘并在
此之上创建一个普通的文件系统。Ramdisks无法swap因此无法调整它们的大小。
由于tmpfs完全保存于页面缓存和swap中因此所有tmpfs页面将在/proc/meminfo
中显示为“Shmem”而在free(1)中显示为“Shared”。请注意这些计数还包括
共享内存(shmem请参阅ipcs(1))。获得计数的最可靠方法是使用df(1)和du(1)。
tmpfs具有以下用途
1) 内核总有一个无法看到的内部挂载用于共享匿名映射和SYSV共享内存。
挂载不依赖于CONFIG_TMPFS。如果CONFIG_TMPFS未设置tmpfs对用户不可见。
但是内部机制始终存在。
2) glibc 2.2及更高版本期望将tmpfs挂载在/dev/shm上以用于POSIX共享内存
(shm_openshm_unlink)。添加内容到/etc/fstab应注意如下
tmpfs /dev/shm tmpfs defaults 0 0
使用时需要记住创建挂载tmpfs的目录。
SYSV共享内存无需挂载内部已默认支持。(在2.3内核版本中,必须挂载
tmpfs的前身(shm fs)才能使用SYSV共享内存)
3) 很多人(包括我)都觉的在/tmp和/var/tmp上挂载非常方便并具有较大的
swap分区。目前循环挂载tmpfs可以正常工作所以大多数发布都应当可以
使用mkinitrd通过/tmp访问/tmp。
4) 也许还有更多我不知道的地方:-)
tmpfs有三个用于调整大小的挂载选项
========= ===========================================================
size tmpfs实例分配的字节数限制。默认值是不swap时物理RAM的一半。
如果tmpfs实例过大机器将死锁因为OOM处理将无法释放该内存。
nr_blocks 与size相同但以PAGE_SIZE为单位。
nr_inodes tmpfs实例的最大inode个数。默认值是物理内存页数的一半或者
(有高端内存的机器)低端内存RAM的页数二者以较低者为准。
========= ===========================================================
这些参数接受后缀km或g表示千兆和千兆字节可以在remount时更改。
size参数也接受后缀用来限制tmpfs实例占用物理RAM的百分比
未指定size或nr_blocks时默认值为size=50
如果nr_blocks=0或size=0block个数将不受限制如果nr_inodes=0
inode个数将不受限制。这样挂载通常是不明智的因为它允许任何具有写权限的
用户通过访问tmpfs耗尽机器上的所有内存但同时这样做也会增强在多个CPU的
场景下的访问。
tmpfs具有为所有文件设置NUMA内存分配策略挂载选项(如果启用了CONFIG_NUMA),
可以通过“mount -o remount ...”调整
======================== =========================
mpol=default 采用进程分配策略
(请参阅 set_mempolicy(2))
mpol=prefer:Node 倾向从给定的节点分配
mpol=bind:NodeList 只允许从指定的链表分配
mpol=interleave 倾向于依次从每个节点分配
mpol=interleave:NodeList 依次从每个节点分配
mpol=local 优先本地节点分配内存
======================== =========================
NodeList格式是以逗号分隔的十进制数字表示大小和范围最大和最小范围是用-
分隔符的十进制数来表示。例如mpol=bind0-3,5,7,9-15
带有有效NodeList的内存策略将按指定格式保存在创建文件时使用。当任务在该
文件系统上创建文件时会使用到挂载时的内存策略NodeList选项如果设置的话
由调用任务的cpuset[请参见Documentation/admin-guide/cgroup-v1/cpusets.rst]
以及下面列出的可选标志约束。如果NodeLists为设置为空集则文件的内存策略将
恢复为“默认”策略。
NUMA内存分配策略有可选标志可以用于模式结合。在挂载tmpfs时指定这些可选
标志可以在NodeList之前生效。
Documentation/admin-guide/mm/numa_memory_policy.rst列出所有可用的内存
分配策略模式标志及其对内存策略。
::
=static 相当于 MPOL_F_STATIC_NODES
=relative 相当于 MPOL_F_RELATIVE_NODES
例如mpol=bind=staticNodeList相当于MPOL_BIND|MPOL_F_STATIC_NODES的分配策略
请注意如果内核不支持NUMA那么使用mpol选项挂载tmpfs将会失败nodelist指定不
在线的节点也会失败。如果您的系统依赖于此但内核会运行不带NUMA功能(也许是安全
revocery内核)或者具有较少的节点在线建议从自动模式中省略mpol选项挂载选项。
可以在以后通过“mount -o remount,mpol=Policy:NodeList MountPoint”添加到挂载点。
要指定初始根目录,可以使用如下挂载选项:
==== ====================
模式 权限用八进制数字表示
uid 用户ID
gid 组ID
==== ====================
这些选项对remount没有任何影响。您可以通过chmod(1),chown(1)和chgrp(1)的更改
已经挂载的参数。
tmpfs具有选择32位还是64位inode的挂载选项
======= =============
inode64 使用64位inode
inode32 使用32位inode
======= =============
在32位内核上默认是inode32挂载时指定inode64会被拒绝。
在64位内核上默认配置是CONFIG_TMPFS_INODE64。inode64避免了单个设备上可能有多个
具有相同inode编号的文件比如32位应用程序使用glibc如果长期访问tmpfs一旦达到33
位inode编号就有EOVERFLOW失败的危险无法打开大于2GiB的文件并返回EINVAL。
所以'mount -t tmpfs -o size=10G,nr_inodes=10k,mode=700 tmpfs /mytmpfs'将在
/mytmpfs上挂载tmpfs实例分配只能由root用户访问的10GB RAM/SWAP可以有10240个
inode的实例。
:作者:
Christoph Rohland <cr@sap.com>, 1.12.01
:更新:
Hugh Dickins, 4 June 2007
:更新:
KOSAKI Motohiro, 16 Mar 2010
:更新:
Chris Down, 13 July 2020