linux-zen-server/Documentation/translations/zh_CN/infiniband/ipoib.rst

112 lines
4.1 KiB
ReStructuredText
Raw Permalink Blame History

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

.. include:: ../disclaimer-zh_CN.rst
:Original: Documentation/infiniband/ipoib.rst
:翻译:
司延腾 Yanteng Si <siyanteng@loongson.cn>
:校译:
王普宇 Puyu Wang <realpuyuwang@gmail.com>
时奎亮 Alex Shi <alexs@kernel.org>
.. _cn_infiniband_ipoib:
=========================
infiniband上的IPIPoIB
=========================
ib_ipoib驱动是IETF ipoib工作组发布的RFC 4391和4392所规定的
infiniband上IP协议的一个实现。它是一个“本地”实现即把接口类型设置为
ARPHRD_INFINIBAND硬件地址长度为20早期的专有实现向内核伪装为以太网
接口)。
分区和P_Keys
============
当IPoIB驱动被加载时它会使用索引为0的P_Key给每个端口创建一个接口。要用
不同的P_Key创建一个接口将所需的P_Key写入主接口的
/sys/class/net/<intf name>/create_child文件里面。比如说::
echo 0x8001 > /sys/class/net/ib0/create_child
这将用P_Key 0x8001创建一个名为ib0.8001的接口。要删除一个子接口,使用
``delete_child`` 文件::
echo 0x8001 > /sys/class/net/ib0/delete_child
任何接口的P_Key都由“pkey”文件给出而子接口的主接口在“parent”中。
子接口的创建/删除也可以使用IPoIB的rtnl_link_ops来完成使用两种
方式创建的子接口的行为是一样的。
数据报与连接模式
================
IPoIB驱动支持两种操作模式数据报和连接。模式是通过接口的
/sys/class/net/<intf name>/mode文件设置和读取的。
在数据报模式下使用IB UD不可靠数据报传输因此接口MTU等于IB L2 MTU
减去IPoIB封装头4字节。例如在一个典型的具有2K MTU的IB结构中IPoIB
MTU将是2048 - 4 = 2044字节。
在连接模式下使用IB RC可靠的连接传输。连接模式利用IB传输的连接特性
允许MTU达到最大的IP包大小64K这减少了处理大型UDP数据包、TCP段等所需的
IP包数量提高了大型信息的性能。
在连接模式下接口的UD QP仍被用于组播和与不支持连接模式的对等体的通信。
在这种情况下ICMP PMTU数据包的RX仿真被用来使网络堆栈对这些邻居使用较
小的UD MTU。
无状态卸载
==========
如果IB HW支持IPoIB无状态卸载IPoIB会向网络堆栈广播TCP/IP校验和/或大量
传送LSO负载转移能力。
大量传送LSO负载转移也已实现可以使用ethtool调用打开/关闭。目前LRO
只支持具有校验和卸载能力的设备。
无状态卸载只在数据报模式下支持。
中断管理
========
如果底层IB设备支持CQ事件管理可以使用ethtool来设置中断缓解参数从而减少
处理中断产生的开销。IPoIB的主要代码路径不使用TX完成信号的事件所以只支持
RX管理。
调试信息
========
通过将CONFIG_INFINIBAND_IPOIB_DEBUG设置为“y”来编译IPoIB驱动跟踪信
息被编译到驱动中。通过将模块参数debug_level和mcast_debug_level设置为1来
打开它们。这些参数可以在运行时通过/sys/module/ib_ipoib/的文件来控制。
CONFIG_INFINIBAND_IPOIB_DEBUG也启用debugfs虚拟文件系统中的文件。通过挂
载这个文件系统,例如用::
mount -t debugfs none /sys/kernel/debug
可以从/sys/kernel/debug/ipoib/ib0_mcg等文件中获得关于多播组的统计数据。
这个选项对性能的影响可以忽略不计所以在正常运行时在debug_level设置为
0的情况下启用这个选项是安全的。
CONFIG_INFINIBAND_IPOIB_DEBUG_DATA当data_debug_level设置为1时可以
在数据路径中启用更多的调试输出。 然而,即使禁用输出,启用这个配置选项也
会影响性能,因为它在快速路径中增加了测试。
引用
====
在InfiniBand上传输IPIPoIBRFC 4391
http://ietf.org/rfc/rfc4391.txt
infiniband上的IP:上的IP架构RFC 4392
http://ietf.org/rfc/rfc4392.txt
infiniband上的IP: 连接模式 (RFC 4755)
http://ietf.org/rfc/rfc4755.txt