hit counter script
NEC N8105-58 User Manual
NEC N8105-58 User Manual

NEC N8105-58 User Manual

Gpu computing card (tesla a100)

Advertisement

Quick Links

N8105-58
ユーザーズガイド
本書を熟読し、大切に保管してください。
Read this document carefully, and keep at hand so that it is available whenever necessary.
構成品一覧表 /
Packing List
本製品には以下のものが添付されています。確認してください。
This product is shipped with the following items, verify package contents:
GPU コンピューティングカード
GPU Computing Card
保証書
Warranty Card
シリアル番号ラベル
Serial number label
取扱説明書
User's Guide
※本製品を本体装置に組み込んでお買い求め頂いた場合、本体装置に添付された保証書が本製品の保証書を
兼ねます。 本体装置の保証書に本製品の記載があるかご確認ください。
Note:
This warranty is available only for using in Japan.
Do not use it in any other than Japan.
GPU コンピューティングカード(Tesla A100)/
GPU Computing Card (Tesla A100)
(第 2 版)
品名
Name
/ User's Guide
数量
Qty.
NVIDIA Tesla A100 PCIe 40GB Computational
1
Accelerator for HPE
組込出荷時は添付されません。
1
本体装置の保証書に記載されます。
Only for using in Japan.
1
大切に保管してください
1
安全上の注意事項
(2nd. Edition)
備考
Memo.

Advertisement

Table of Contents
loading

Summary of Contents for NEC N8105-58

  • Page 1 N8105-58 GPU コンピューティングカード(Tesla A100)/ GPU Computing Card (Tesla A100) ユーザーズガイド / User’s Guide (第 2 版) (2nd. Edition) 本書を熟読し、大切に保管してください。 Read this document carefully, and keep at hand so that it is available whenever necessary. 構成品一覧表 / Packing List 本製品には以下のものが添付されています。確認してください。 This product is shipped with the following items, verify package contents: 品名...
  • Page 2: Table Of Contents

    目次 使用上のご注意 -必ずお読みください- ..............J-1 安全に関わる表示について ......................J-1 本書で使用する記号とその内容 ....................J-2 安全上のご注意 ........................... J-3 はじめに ........................J-7 本書について ......................J-7 本文中の記号について ........................ J-7 本製品について ....................J-8 1.1. 特徴 ..........................J-8 1.2. 各部の名称と機能 ......................J-8 本体装置への取り付けと取り外し ..............J-10 ドライバ/ソフトウェアのセットアップ ............J-11 3.1.
  • Page 3 Table of Contents Precautions for Use -Be sure to read this section - ....... E-2 Safety Indication ......................... E-2 Symbols Used in This Guide .................... E-3 Precautions for Safety ....................... E-4 Introduction ...................... E-8 About this Guide ....................E-8 Text Conventions ......................... E-8 General Description................
  • Page 4 Red Hat、Red Hat Enterprise Linux は、米国およびその他の国における Red Hat, Inc.の登録商標または商標です。 Linux は、Linus Torvalds 氏の米国およびその他の国における商標または登録商標です。 ご注意 1. 本書の内容の一部または全部について、許可なく複製・転載・翻訳・他形式・メディアへの変換等を行うこと は、禁止されています。 2. 本書の内容については、将来予告なしに変更することがあります。 3. 本書の内容については、万全を期して作成いたしましたが、万一お気付きの点や、ご不明の点がありました ら、販売店または弊社までご連絡ください。 4. 本製品を運用した結果の影響については、上記 3 項にかかわらずいかなる責任も負いかねますので、ご了承 ください。 5. 本書は、本体装置の操作に熟知した管理者、または保守員向けに記載されております。本体装置の取り扱い や、各種 OS の操作、その他一般的かつ、基本的な事柄につきましては記載を省いておりますのであらかじめ ご了承ください。 NEC Corporation 2021 © 日本電気株式会社の許可無く、本書の複製・改変などを行うことはできません。 クラス B 機器 この装置は、クラス B 機器です。この装置は、住宅環境で使用すること を目的としていますが、この装置がラジオやテレビジョン受信機に近接 して使用されると、受信障害を引き起こすことがあります。 取扱説明書に従って正しい取り扱いをして下さい。 VCCI-B...
  • Page 5 Note that the basic information, such as the operation procedures of the device and OS, is omitted. No part of this guide may be reproduced or changed in any form without prior written permission of NEC Corporation ©...
  • Page 6 이 기기는 가정용(B급) 전자파적합기기로서 주로 가정에서 (가정용 방송통신기자재) 사용하는 것을 목적으로 하며, 모든 지역에서 사용할 수 있습니다. Importer EU Contact: NEC Nederland B.V. Olympia 4, 1213 NT Hilversum, The Netherlands Trademark, name and address of the manufacturer: NVIDIA Corporation 2788 San Tomas Expressway, Santa Clara, CA 95051 USA...
  • Page 7 If you wish to dispose of used electrical and electronic products outside the European Union, please contact your local authority and ask for the correct method of disposal. Importer EU Contact: NEC Nederland B.V. Olympia 4, 1213 NT Hilversum, The Netherlands This product is RoHS Compliant.
  • Page 8: 安全に関わる表示について

    この取扱説明書は、必要なときすぐに参照できるよう、お手元に置いておくようにしてくださ い。 「使用上のご注意」を必ずお読みください。 使用上のご注意 -必ずお読みください- 本製品を安全に正しくご使用になるために必要な情報が記載されています。 安全に関わる表示について 本製品を安全にお使い頂くために、この取扱説明書の指示に従って操作してください。 この取扱説明書には装置のどこが危険でどのような危険に遭うおそれがあるか、どうすれば危険を避けられ るかなどについて説明されています。 取扱説明書では危険の程度を表す言葉として、 「警告」と「注意」という用語を使用しています。 それぞれの用語は次の意味を持つものとして定義しています。 “取扱いを誤った場合、 使用者が死亡または重傷(*1)を負うことが想定される こと”を示します。 “取扱いを誤った場合、使用者が傷害(*2)を負うことが予想されるか、または 物的損害(*3)の発生が想定されること”を示します。 重傷とは、失明やけが、やけど(高温・低温)、感電、骨折、中毒などで後遺症が残るものおよび治療に入 院・長期の通院を要するものをさします。 傷害とは、治療に入院や長期の通院を要さない、けが、やけど、感電などをさします。 物的損害とは、家屋・家財および家畜・ペット等にかかわる拡大損害をさします。 危険に対する注意・表示は次の 3 種類の記号を使って表しています。それぞれの記号は次のような意味を持 つものとして定義しています。 この記号は、危険が発生するおそれがあることを表しま す。記号の中の絵表示は危険の内容を図案化したもので 注意の喚起 (例) す。 (感電注意) この記号は行為の禁止を表します。記号の中や近くの絵 表示は、してはならない内容を図案化したものです。 行為の禁止 (例) (分解禁止) この記号は行為の強制を表します。記号の中の絵表示は、 しなければならない行為の内容を図案化したものです。 行為の強制 (例) 危険を避けるためには、この行為が必要です。...
  • Page 9: 本書で使用する記号とその内容

    危険の程度を表す用語 危険に対する注意の内容 注意を促す記号 指定以外のコンセントに差し込まない 指定の電圧で、指定のコンセントをお使いください。 指定以外の電源を使うと火災や漏電の原因となります。 本書で使用する記号とその内容 注意の喚起 感電のおそれのあることを示します。 発煙または発火のおそれがあることを示しま す。 特定しない一般的な注意。警告を示しま 高温による傷害を負うおそれがあることを示 す。 します。 行為の禁止 本装置を分解。修理。改造しないでくださ 水や液体がかかる場所で使用しないでくだ い。感電や火災のおそれがあります。 さい。水に濡らすと感電や発火のおそれが あります。 特定しない一般的な禁止を示します。 行為の強制 本装置の電源プラグをコンセントから抜 いてください。火災や感電のおそれがあ ります。...
  • Page 10: 安全上のご注意

    安全上のご注意 本装置を安全にお使い頂くために、ここで説明する注意事項をよく読んで理解し、安全に活用してください。 安全に関わる表示について 記号の説明については「 」 (J-1 ページ)の説明を参照してください。 一般的な注意事項 人命に関わる業務や高度な信頼性を必要とする業務には使用しない 本製品は医療機器・原子力設備や機器、航空宇宙機器・輸送設備や機器など、人命に 関わる設備および高度な信頼性を必要とする設備などには使用しないでください。 これらの設備に本製品を使用した結果、 人身事故、 財産損害などが生じても当社はい かなる責任も負いかねます。 煙や異臭、異音がしたまま使用しない 万一、煙、異臭、異音などが生じた場合は、直ちに装置の電源を OFF にした後、本 体装置の電源コードをコンセントから取り外してください。 その後、 お買い求めの販 売店または保守サービス会社にご連絡ください。 そのまま使用すると火災の原因とな ります。 針金や金属片を差し込まない アダプタに金属片や針金などの異物を差し込まないでください。 感電の危険がありま す。 アダプタに水や異物を入れない アダプタに水などの液体、 ピンやクリップなどの異物を入れないでください。 火災や 感電、故障の原因となります。もし入ってしまったときは、すぐ電源を OFF にして、 電源コードをコンセントから抜いてください。 分解しないで、 販売店または保守サー ビス会社にご連絡ください。...
  • Page 11 設置・移動・保管・接続に関する注意事項 指定以外のインタフェイスケーブルを使用しない インタフェイスケーブルは、 適合するものを使用し、 接続する装置やコネクタを確認 した上で接続してください。 指定以外のケーブルを使用したり、 接続先を誤ったりす ると、ショートにより火災を起こすことがあります。 また、 インタフェイスケーブルの取り扱いや接続について、 次の注意をお守りくださ い。 破損したケーブルコネクタを使用しない  ケーブルを踏まない  ケーブルの上にものを載せない  ケーブルの接続がゆるんだまま使用しない  破損したケーブルを使用しない  腐食性ガスの存在する環境で使用または保管しない 腐食性ガス(二酸化硫黄、硫化水素、二酸化窒素、塩素、アンモニア、オゾンなど) の存在する環境に設置し、使用しないでください。 また、ほこりや空気中に腐食を促進する成分(塩化ナトリウムや硫黄など)や導電性 の金属などが含まれている環境へも設置しないでください。 装置内部のプリント板が 腐食し、故障および発煙・発火の原因となるおそれがあります。 もしご使用の環境で上記の疑いがある場合は、 販売店または保守サービス会社にご相 談ください。 廃棄・譲渡に関する注意事項  本製品を廃棄する場合は各自治体の条例に従ってください。 詳しくは、 各自治体にお問い合わせください。  本製品を他人に譲渡する場合は、本書および添付品すべてを必ず一緒 に渡してください。...
  • Page 12 取扱注意事項 分解・修理・改造はしない 本製品を分解したり、修理・改造を行ったりしないでください。 感電や火災の危険があります。 本体装置の電源コードを抜く 本体装置への取り付け・取り外しをするときには、 必ず電源コードをコンセントから 外してください。感電するおそれがあります。 高温に注意する 本体装置の電源を OFF にした直後は、装置内の部品が高温になっています。十分に 冷めたことを確認してから取り付け/取り外しを行ってください。 人体から静電気を放電してから取り扱う 静電気による部品の破壊を防ぐため、 アダプタに触れる前には、 必ず人体から静電気 を放電してください。 アダプタ上で塗装されていない金属部分には触れない アダプタの各部品の端子部、 およびアダプタ上で塗装されていない金属部分には、 決 して触れないでください。 汚れや腐蝕等により、 接触不良が発生するおそれがありま す。また、濡れた手や汚れた手で触れないでください。 アダプタを無理に挿入しない アダプタを本体装置に搭載する際は、 無理に挿入しないでください。 その際アダプタ、 および本体装置を破損するおそれがあります。 ブラケットの先端部を本体装置のボード部等に触れない アダプタを拡張スロットに挿入する際、 ブラケットの先端が本体装置の他の部位 (他 の部品、 ボードなど) に触れないようにご注意ください。 破損するおそれがあります。 ケーブルは確実に接続する ケーブル接続時は、カチッという音がするまでケーブルコネクタを挿入してくださ...
  • Page 13 静電気対策について 製品の取り付け/取り外しについて 準備確認事項 (1) 危険防止及び故障防止のため作業を行なう際には、本体装置の電源スイッチをOFFに し、電源プラグをコンセントから抜いてください。但し、ホットスワップ(活線挿 抜)対象製品の取り付け/取り外し時の電源スイッチのOFFおよび電源プラグのコン セントからの取り外しは除きます。 (2) 本製品は静電気に弱い電子部品で構成されています。製品の取り付け/取り外しの際 は、静電気による製品の故障を防止するため静電気対策用リストストラップなどの装 着により静電気を除去してください。また、リストストラップを使用する場合は、接 地された箇所に接続して使用してください。...
  • Page 14: はじめに

    はじめに このたびは、N8105-58 GPU コンピューティングカード(Tesla A100)をお買い求めいただき、誠にありがとうご ざいます。 本製品の持つ機能を最大限に引き出すためにも、 ご使用になる前に本書をよくお読みになり、 装置の取 り扱いを十分にご理解ください。 本書について 本書は、 本製品を正しくセットアップし、 安全に使用できるようにするための手引きです。 製品のセットアップを 行うときや製品の取り扱いがわからないときなどにご利用ください。 本書は常に製品のそばに置いて いつでも見られるようにしてください。 本文中の記号について 本書では巻頭で示した安全に関わる注意記号の他に、3 種類の記号を使用しています。 これらの記号と意味をご理解になり装置を正しくお取り扱いください。 装置の取り扱いや、ソフトウェアの操作で守らなければならない事柄 や、特に注意すべき点を示します。 装置やソフトウェアを操作する絵で、確認しておく必要がある点を示 します。 知っておくと役立つ情報や、便利なことを示します。...
  • Page 15: 本製品について

    ルハイトサイズで 2 枚幅のブラケットが取り付けられています。ブラケットは交換できません。 リテーナー  PCI EXPRESS カードをサーバシャーシ内部の機構に固定するための延長用金具です。 本製品はリテーナ ーを取り付けた状態でフルレングスのサイズとなります。リテーナーは取り外さずにお使いください。 電源コネクタ  本製品の動作のための補助用電源コネクタです。別売りの「K410-387(00) グラフィックスカード電源 ケーブル(8Pin. B タイプ)」または「K410-477(00) グラフィックスカード電源ケーブル(8Pin. B タイ プ)」を接続してください。本製品後部に装備しています。 PCI-Express®コネクタ  PCI-EXPRESS 規格に準拠しています。本体装置の PCIEXPRESS スロットにリテンションロックがある 場合には、本製品のリテンションフックが固定できます。 カードエッジサイズ、論理接続レーン数は次の通りです。 型番 準拠規格 カードエッジ 論理レーン数 N8105-58 PCI Express 4.0* *本製品を搭載可能な本体装置であれば、搭載先スロットが PCI-Express 3.0 の場合でも、動作可能です。...
  • Page 16 ボード前面 ヒートシンク リテーナー リテンションフック PCI EXPRESS コネクタ ブラケット ボード背面 リテーナー リテンションフック ブラケット PCI EXPRESS コネクタ ボード前部/後部 GPU電源コネクタ ヒートシンク リテーナー ブラケット 各部の名称...
  • Page 17: 本体装置への取り付けと取り外し

    2. 本体装置への取り付けと取り外し 本製品および「グラフィックスカード電源ケーブル(8Pin. B タイプ)」の本体装置への取り付け・取り外しについ ては、本体装置のユーザーズガイドを参照して作業してください。 本製品の取り付けには、 「K410-387(00) グラフィックスカード電源ケーブル(8Pin. B タイ  プ)」または「K410-477(00) グラフィックスカード電源ケーブル(8Pin. B タイプ)」が必要 です。本体装置の型番に合せてお選びください。 必ず本体装置のユーザーズガイドを参照して、本製品の取り付け・取り外しを行ってください。  本製品を R120i-2M 上の RedHat Enterprise Linux 8.3 でご使用になる場合は、OS のイン  ストールが完了し、 「Linux ドライバ」 のインストール手順にて指示があるまで本製品の取り付 けを行わないようにしてください。 本体装置の電源コードを抜く 本体装置への取り付け・取り外しをするときには、必ず電源コードをコンセントから外してくださ い。感電するおそれがあります。 高温に注意する 本体装置の電源を OFF にした直後は、装置内の部品が高温になっています。十分に冷めたことを 確認してから取り付け/取り外しを行ってください。...
  • Page 18: ドライバ/ソフトウェアのセットアップ

    3. ドライバ/ソフトウェアのセットアップ 本製品のドライバ/ソフトウェアは NEC のサポートサイトからダウンロードすることができます。 NEC サポートサイト URL http://jpn.nec.com/express/ 「サポート情報」の「ダウンロード」に入り、 キーワード欄に「N8105-58」を入力して下さい。 また、臨時にドライバがリリースされることもございますので、同サイトのサポート情報を確認 して、必要に応じて適用してください。 3.1. Windows ドライバ 3.1.1. GPU コンピューティングドライバ(ディスプレイドライバ)のインストール OS を起動後 Administrator 権限のあるアカウントでログインします。 ※OS の PnP 機能により本製品が検出され、[新しいハードウェアの検出ウィザード]が起動することがあ ります。この場合には[キャンセル]ボタンをクリックしてウィザードを終了してください。 あらかじめ用意したドライバを適当なフォルダにコピーして、ZIP ファイルを解凍します。 ZIP ファイルを右クリックして[全て展開(T)...]を選択してください。 エクスプローラを起動します。 タスクバーにある[エクスプローラ]のアイコンをクリックします。 スタートボタンの上で右クリックし、[エクスプローラ]をクリックします。 展開されたフォルダ内にある[xxx.exe]をエクスプローラでダブルクリックしてインストーラを起動しま す。※ご利用の OS やドライバのバージョンによってインストーラのファイル名が異なります。 ドライバのインストール...
  • Page 19 インストールする形式の選択を行います。 [高速(推奨)(E)]にチェックが入っていることを確 認して[次へ(N)]ボタンをクリック [閉じる(C)]ボタンをクリックしてインストーラを 終了してください。 インストーラ終了後に OS を再起動してください。 J-12...
  • Page 20 3.1.2. GPU コンピューティングドライバ(ディスプレイドライバ)のアンインストール OS を起動後 Administrator 権限のあるアカウントでログインします。 スタートアイコンの上で右クリックし、 [コントロールパネル]⇒[プログラムのアンインストール]の順 にクリックします。 (表示方法が「大きいアイコン」または「小さいアイコン」表示の場合は、[プログラムと機能]をクリッ クする。) 表示されているプログラム一覧から[NVIDIA グ ラフィックス ドライバー xxx.xx]をダブルクリ ックしてアンインストールを開始してください。 ※ OS に対応したドライバーバージョンが表示 されます。 ※ このとき、ユーザーアカウント制御に関する 許可を求められた場合は[続行]または[はい]をク リックしてアンインストールを続けてください。 [アンインストール(U)]ボタンをクリックしてア ンインストールを続行してください。 [今すぐ再起動する(R)]ボタンをクリックして再 起動を行ってください。 アンインストールが終わると再起動を要求されます。アンインストールを反映させるにはシステムの再 起動が一度必要になりますので、[はい]をクリックして再起動を行ってください。 J-13...
  • Page 21: Linux ドライバ

    3.2. Linux ドライバ RHEL 8.2 にて本製品を運用している環境を RHEL 8.3 へアップグレードする場合は、RHEL  8.3 へのアップグレード完了後に、下記の手順に従い RHEL 8.3 用ドライバをインストールし てください。 RHEL 8.3 を新規インストールするために RHEL 8.1 から RHEL 8.3 へのアップグレードを  行う場合は、先に RHEL 8.1 のインストールを行い下記の手順 5~6 に従って、nouveau ド ライバの無効化を実施した後に RHEL 8.3 へのアップグレードを行ってください。 本製品を R120i-2M で使用する場合は、事前に OS のインストールを完了させ下記の手順6ま ...
  • Page 22 Nouveau ドライバを無効化します。 本手順では、nouveau ドライバをロードしない起動イメージファイルを作成しますので、 実施前に手順をご確認していただき、 ご使用の環境を考慮した上で十分に注意して実行して ください。 以下の手順で nouveau ドライバをロードしない起動イメージファイルを作成します。 1) 下記ディレクトリに次のファイルを作成し、内容を記述して保存してください。 ディレクトリ: /etc/modprobe.d/ ファイル名 : blacklist-nouveau.conf 内容 blacklist nouveau options nouveau modeset=0 2) 次のコマンドを実行して起動イメージファイルを作成してください。 # dracut --force ※このコマンドを実行することで、起動時に nouveau ドライバをロードしない起動イメージ ファイルを作成します。 3) OS を再起動してください。 再起動後に端末を起動して次のコマンドを実行し、nouveau がロードされていないことを確認してくだ さい。 # lsmod | grep nouveau X-Window System が起動している場合は、手順...
  • Page 23 elfutils-libelf-devel パッケージがインストールされていないことを確認します。 下記コマンドを実行してください。 # yum list installed | grep elfutils-libelf-devel ご使用の環境によっては、elfutils-libelf-devel パッケージがインストールされている場合があります。 その場合は手順 9 へ進んでください。 elfutils-libelf-devel パッケージをインストールします。 ※下記の説明におけるインストールメディアのマウント先は一例です。 ご使用の環境に合わせて、適宜変更してください。 1) 下記コマンドを実行して、ディレクトリ”/media/cdrom”を作成します。 # mkdir /media/cdrom 2) 光ディスクドライブにインストールメディアをセットし、下記コマンドを実行してインストール メディアをマウントします。 # mount -r -t iso9660 /dev/sr0 /media/cdrom 3) 下記ディレクトリに次のファイルを作成し、内容を記述して保存してください。 ディレクトリ: /etc/yum.repos.d/ ファイル名 : dvd.repo 内容...
  • Page 24 GPU ドライバをインストールします。 手順 3 で実行許可の権限を付与したファイルを実行してください。 # sh xxx.run インストーラの実行中に選択、または入力を求めてくる場合がございますので、ご使用の環境に合わせ た選択、または入力を実施してください。参考までに以下に実行例を記載します。 (実行例) Install NVIDIA’s 32-bit compatibility libraries? ⇒ Yes を選択 WARNING: Unable to determine the path to install the libglvnd EGL vendor library config files. Check that you have pkg-config and the libglvnd development libraries installed, or specify a path with –glvnd-eglconfig-path.
  • Page 25 3.2.2. GPU コンピューティングドライバ(ディスプレイドライバ)のアンインストール OS を起動後、root 権限をもつユーザーでログインします。 X-Window System が起動している場合は終了させてください。 端末を起動して下記コマンドを実行してください。 # systemctl isolate multi-user.target 下記コマンドを実行し、GPU ドライバをアンインストールしてください。 # nvidia-installer -uninstall アンインストーラーの実行中に選択、または入力を求めてくる場合がございますので、ご使用の環境に 合わせた選択、または入力を実施してください。参考までに以下に実行例を記載します。 If you plan to no longer use the NVIDIA driver, you should make sure that no X screens are configured to use the NVIDIA X driver in your X configuration file.
  • Page 26: トラブルシューティング

    4. トラブルシューティング 本章では各事象に対する確認のため本製品の取り外し/取り付けを前提とした作業  を記載しています。事前に必ず取扱注意事項をお読みください。 必要に応じて本製品をお買い求めの販売店または保守サービス会社に連絡してく  ださい。 4.1. システムが起動できない場合 ボードの取り付けを確認してください □ 搭載スロットは適切か 本体装置のシステム構成ガイド等を参照して、本製品の搭載可能スロットに搭載されていることを確認 してください。異なる場合は正しいスロットに搭載してください。 □ 取り付けは正しいか 本体装置のスロットに、ボードがしっかりと差し込まれているか確認してください。また、固定ネジ(ま たはクリップ)でボードがしっかりと固定されていることを確認してください。 該当する場合は、取り付けなおしてください。 □ 補助電源コネクタは取り付けられているか 本製品は PCI-Express®コネクタからの給電の他、本体装置から補助電源コネクタを通しての給電が必 要となります。本体装置のシステム構成ガイド等を参照して、本製品の搭載可能スロットに搭載されて いることを確認し、 「K410-387(00) グラフィックスカード電源ケーブル(8Pin. B タイプ)」または 「K410-477(00) グラフィックスカード電源ケーブル(8Pin. B タイプ)」が接続されていることを確認 してください。 □ PCI-Express®コネクタなど本体装置側に異常はないか 本体装置の PCI-Express®コネクタを確認し、異物混入や部品破損がないか確認してください。 部品破損等ある場合は本製品をお買い求めの販売店または保守サービス会社に連絡してください。 □...
  • Page 27: シャットダウン時にエラーが記録される

    ボードを確認してください □ ボードが破損していないか ボードの実装部品が破損していないか確認してください。 破損している場合は本製品をお買い求めの販売店または保守サービス会社に連絡してください。 □ ボード実装部品に異物が入り込んでいないか ボード上の実装部品に異物が入り込んでいないか確認してください。 混入している場合は本製品をお買い求めの販売店または保守サービス会社に連絡してください。 □ ボードのコネクタに異物が付着していないか ボードの PCI-Express®コネクタ,補助電源コネクタに異物が付着していないか確認してください 付着している場合は取り除いてください。 以上の項目を確認したにもかかわらず、問題が解決しない場合は、本製品に何らかの故障が発生し ている可能性が考えられます。本製品をお買い求めの販売店または保守サービス会社までお問い合 わせください。 4.2. シャットダウン時にエラーが記録される オペレーティングシステムのシャットダウンの際、稀に本体装置に PCI Bus に関するエラーが記録されることが ありますが、本ボード及び本体装置の故障を示すものではありません。 本事象発生時には、下記のエラーメッセージが本体装置の iLO 上に記録されます。 ■エラーメッセージ(iLO の IML( Integrated Management Log [Information] - [Integrated Management Log] (1)PCI Bus Uncorrectable PCI Express Error Detected.
  • Page 28: 運用における注意事項

    5. 運用における注意事項 1. システムあたりの最大搭載枚数は、本体装置及び装置の構成により異なりますので、本体装置のシステム構 成ガイドを参照してください。 2. PCI ホットプラグ、スワップ、リムーブはサポートしていません。 GPU 電源コネクタには「K410-387(00) グラフィックスカード電源ケーブル(8Pin. B タイプ)」または 「K410-477(00) グラフィックスカード電源ケーブル(8Pin. B タイプ)」を接続してください。それ以外の ケーブルはサポートしていません。 J-21...
  • Page 29: 製品仕様

    6. 仕様 6.1. 製品仕様 ® インタフェース PCI-Express 4.0 準拠 データレート 16GT/s x16 レーン (Gen.4) ® コネクタ PCI-Express x16 レーン (Gen.4) メモリ 40GB (4096bit HBM2) NVIDIA CUDA コア 6912 コア NVIDIA Tensor コア 432 コア 外形寸法 266.7mm(L) 111.2mm(W) (ブラケット/リテーナー含まず) 重量 1296g(ブラケット、リテーナー装着時) 動作電圧...
  • Page 30: Safety Indication

    Keep this Startup Guide at hand for quick reference at any time necessary. Be sure to read this section carefully. Precautions for Use -Be sure to read this section - The following includes information necessary for proper and safe operation of the product. Safety Indication Follow the instructions in this Guide for your safety to use this product.
  • Page 31: Symbols Used In This Guide

    Term indicationg a degree of danger Description of a danger Symbol to draw attention Do not plug the power cord in a nonconforming outlet Use a wall outlet with specified voltage and power type. Otherwise, there is a risk of a fire or current leakage. Symbols Used in This Guide Attentions Indicates a risk of an electric shock.
  • Page 32: Precautions For Safety

    NEC assumes no liability for any accident resulting in personal injury, death, or property damage if the product has been used in the above conditions.
  • Page 33 Connection Do not use any unauthorized interface cable. Use only interface cables authorized by NEC and locate a proper device and connector before connecting a cable. Using an authorized cable or connecting a cable to an improper destination may cause a short circuit, resulting in a fire.
  • Page 34 Precautions for Handling of Internal Devices Do not disassemble, repair, or modify the product yourself Do not disassemble, repair, or modify this product. Doing so may cause an electrical shock or a fire. Do not put the product close to fire, or immerse it in water. Doing so may cause an explosion.
  • Page 35 Anti-static Measures Installing or Uninstalling Internal Optional Devices (1) To avoid electric hazard and malfunction of the device, be sure to turn off the Power switch of the server and unplug the power cord from outlet before starting work, except for hot-swappable devices.
  • Page 36: Introduction

    Introduction Thank you very much for purchasing our products. To maximize the functionality of this product, please read this guide carefully and follow the instructions for proper handling. About this Guide This guide describes how to handle and use this product properly. Keep this guide at hand for your future reference.
  • Page 37: General Description

    This product is a PCI-EXPRESS 4.0 compliant GPGPU card equipped with a CUDA core processor of 6912 cores and a Tensor core of 432 cores and 40GB of HBM2 memory. Card size is full-length full-height, double-width card that occupies two slots. Do not install this product to a computer that is not recommended by NEC IMPORTATANT: Corporation.
  • Page 38 Front View Heat sink Retainer Retention hook Bracket PCI EXPRESS connector Rear View Retainer Retention hook PCI EXPRESS connector Bracket Bracket View/ Tail View GPU Power connector Heat sink Retainer Bracket E-10...
  • Page 39: Hardware Installation/Uninstallation

    2. Hardware Installation/Uninstallation Refer to the User's Guide of the server for installation and removal of this product and” Graphics card power cable (8Pin. B type)” to the server. "K410-387 (00) Graphics Card Power Cable (8Pin. B Type)" or “K410-477 (00) Graphics Card Power Cable (8Pin.
  • Page 40: Driver/Software Setup

    3. Driver/Software Setup The driver software for this product can be downloaded from the NEC support site. Support site URL: http://www.nec.com/express/ Go to "Support & Downloads" and enter the model number. In addition, the driver may be released temporarily, so please check the support information on the site and apply it as necessary.
  • Page 41 Select the format to install. Confirm that [Express (Recommended)] is checked and click [NEXT] button Click the [CLOSE] button to exit the installer. Please reboot the OS after the installer finishes. E-13...
  • Page 42 3.1.2. Uninstall the GPU computing driver (Display driver) After starting the OS Log in using an account with Administrator privileges. Right-click on the start icon, and click Control Panel-> Uninstall a program. (If the display method is "large icon" or "small icon", click [Programs and Features].) Double-click [NVIDIA Graphics Driver xxx.xx] from the displayed program list to start uninstallation.
  • Page 43: Linux Driver

    3.2. Linux Driver Installation of the driver for RHEL 8.3 is necessary to the completion of the  upgrade work from RHEL 8.2 to RHEL 8.3 with the equipment which this product was incorporated into. It is necessary to install this product after the installation of the OS completes ...
  • Page 44 Disable nouveau. In this procedure, a boot image file which does not load the nouveau driver NOTE: is created. Please check the procedure before execution and carefully execute it in consideration of your environment. Use the following procedure to create a boot image file that does not load the nouveau driver. Create the following file in the following directory, describe the contents and save it.
  • Page 45 elfutils-libelf-devel It confirms that a package isn't installed. Please execute a following command. # yum list installed | grep elfutils-libelf-devel elfutils-libelf-devel package is sometimes already installed by the environment of the use, exit according to step 9. Installs the elfutils-libelf-devel package. The place where it mounts the installation media in the following explanation is an example.
  • Page 46 Install the GPU driver. Execute the file to which the permission for execution permission has been added in step 3. # sh xxx.run You may be asked to select or enter while the installer is running, so please select or enter according to your environment.
  • Page 47 3.2.2. Uninstall the GPU computing driver (Display driver) After starting the OS, log in as a user with root privileges. If the X-Window System is running, please exit it. Start the terminal and execute the following command. # systemctl isolate multi-user.target Execute the following command to uninstall the GPU driver.
  • Page 48: Trouble Shooting

    4. Trouble Shooting 4.1. Unable to Start the System Check the adapter installation □ Make sure the adapter is mounted proper slot Check the slot is conformed to mount the adapter. Refer to the User’s Guide of the server. If the adapter in not seat proper slot, Seat the adapter to proper slot. □...
  • Page 49: Error Logged On Shutdown

    Unrecoverable I/O Error has occurred. System Firmware will log additional details in a separate IML message entry if possible. (3)CPU Uncorrectable Machine Check Exception(Processor *,APIC ID 0x********, Bank 0x********,Status 0x********'********,Address 0x********'********, Misc 0x********'********) EU Contact: NEC Nederland B.V. Olympia 4, 1213 NT Hilversum, The Netherlands E-21...
  • Page 50: Notes In Operation

    5. Notes in operation Maximum mounting number of this product depends on type of the server. Please refer to the system configuration guide of the server. PCI hot-plug, hot-add, hot-remove and hot-swap is not supported. Connect the “K410-387 (00) graphics card power cable (8Pin. B type)” or “K410-477 (00) Graphics Card Power Cable (8Pin.
  • Page 51: Specification

    6. Specification 6.1. General Specification ® PCI-Express 4.0 compliant Interface 16GT/s x16 lanes (Gen.4) Data Rate Connector ® PCI-Express x16 lane (Gen.4) 40GB (4096bit HBM2) Memory NVIDIA CUDA core 6912 cores NVIDIA Tensor core 432 cores 266.7mm(L) 111.2mm(W) (w/o Bracket and Retainer) Dimensions 1296g(w/ Bracket and Retainer) Weight...
  • Page 52 N8105-58 GPU コンピューティングカード(Tesla A100) GPU Computing Card (Tesla A100) ユーザーズガイド/ User’s Guide 2021 年 7 月 初版 1st. Edition / July 2021 2021 年 11 月 第 2 版 2nd. Edition / November 2021 日本電気株式会社 NEC Corporation 7-1 Shiba 5-Chome, Minato-Ku 東京都...

Table of Contents