新聞中心
如何解決VMware ESX中出現(xiàn)的常見問題?
作者:無名 2009-07-06 18:53:52
云計算
虛擬化 在這里,我們記錄一些在ESX主機上發(fā)生的、相當(dāng)常見的問題。通常,可以采取一些簡單的步驟去解決這些問題,但有的問題就需要較深入的解決方法。

為揚中等地區(qū)用戶提供了全套網(wǎng)頁設(shè)計制作服務(wù),及揚中網(wǎng)站建設(shè)行業(yè)解決方案。主營業(yè)務(wù)為網(wǎng)站制作、做網(wǎng)站、揚中網(wǎng)站設(shè)計,以傳統(tǒng)方式定制建設(shè)網(wǎng)站,并提供域名空間備案等一條龍服務(wù),秉承以專業(yè)、用心的態(tài)度為用戶提供真誠的服務(wù)。我們深信只要達到每一位用戶的要求,就會得到認可,從而選擇與我們長期合作。這樣,我們也可以走得更遠!
在這里,我們記錄一些在ESX主機上發(fā)生的、相當(dāng)常見的問題。通常,可以采取一些簡單的步驟去解決這些問題,但有的問題就需要較深入的解決方法。
紫屏死機(PSoDs, Purple Screen of Death)
有一種在ESX和ESXi主機上都可能發(fā)生的故障,叫做紫屏死機(可以說是臭名昭著的微軟藍屏死機的VMware版)。紫屏死機會導(dǎo)致ESX/或ESXi主機突然崩潰、變得無法操作。紫屏死機現(xiàn)象如圖10.6所示,你一定不希望在自己的主機上發(fā)生這種現(xiàn)象。
圖10.6 ESX主機上的紫屏死機現(xiàn)象
當(dāng)PSoDs發(fā)生時,ESX會完全死機,沒有任何反應(yīng)。硬件問題(壞有問題的內(nèi)存是最常見的原因)或ESX中的BUG是導(dǎo)致PSoDs的典型原因。當(dāng)PSoDs發(fā)生時,你只能關(guān)閉并重啟主機。屏幕上的提示信息非常有用,應(yīng)該嘗試記錄它:可以使用帶有拍照功能的手機給它照相,或者,如果存在的話,可以從一個遠程管理面板上截圖。你或許看不明白這些捕獲下來的信息,但是,這些信息對VMware的技術(shù)支持來說非常有用。屏幕上顯示的信息包括ESX的版本和build號、異常類型、寄存器轉(zhuǎn)儲(register dump)、崩潰時每個CPU正在跑什么、回溯追蹤(back-trace)、服務(wù)器運行時間、錯誤日志、內(nèi)存硬件信息等。
當(dāng)你遇到PSoDs并重啟主機之后,在ESX主機或/root文件夾下,會有一個以vmkernel-zdump開頭(命名)的文件。這個文件對VMware技術(shù)支持非常有用,同時,你也可以使用該文件,通過vmkdump工具提取 VMkernel日志信息、尋找與PSoDs有關(guān)的線索,從而判斷PSoDs發(fā)生的原因。要使用這個命令,輸入vmkdump –l dump <文件名>。如前所述,壞有問題的內(nèi)存是PSoDs中常見的原因。 你可以使用dump 文件識別引起問題的內(nèi)存模塊,從而將其替換掉。
如果懷疑是壞內(nèi)存引起PSoDs,可以使用一些內(nèi)存壓力測試工具來檢測主機的內(nèi)存。這些工具需要你關(guān)閉主機并從CD啟動以進行內(nèi)存測試。一個常用的工具是Memtest86+,它可以進行廣泛的內(nèi)存測試,比如,檢測鄰近內(nèi)存單元的相互影響,以確保要寫某單元時不會覆蓋鄰近的單元。你可以在www.memtest.org下載這個工具。
當(dāng)你在某個主機上首次部署ESX的時候,進行一次內(nèi)存測試是個好主意,這樣可以避免在以后某個時候內(nèi)存故障引起麻煩。許多的內(nèi)存問題都是不明顯的,簡單的內(nèi)存測試,比如POST過程中的內(nèi)存校驗可能都發(fā)現(xiàn)不了問題。你可以下載Memtest86+測試工具,一個2MB大小的ISO文件,將這個文件刻錄成CD,讓主機從該CD啟動,然后運行該工具至少24小時以完成多種內(nèi)存測試。主機中的內(nèi)存越大,完成一次測試的時間越長,一個擁有32GB內(nèi)存的主機完成一次測試大概需要1天的時間。除了系統(tǒng)內(nèi)存,Memtest86+還檢測CPU的L1和L2 cache。Memtest86+的運行時間不確定,當(dāng)所有的測試都完成時,通過的計數(shù)器會增加。(Memtest86+ will run indefinitely, and the pass counter will increment as all the tests are run.)
服務(wù)器控制臺問題
有時候,你可能會遇到服務(wù)器控制臺問題,表現(xiàn)為:服務(wù)器控制臺掛起,同時,不允許在本地登錄。這種狀況可能是由硬件鎖定或僵尸狀態(tài)引起,但是,通常這種問題不會影響在ESX主機上運行的虛擬機(VM)。重啟是解決這種問題的常用方法,但是,在重啟之前,你應(yīng)該關(guān)閉VM,或者將VM VMmotion到其他的ESX。可以使用各種可用的途徑來操作VM,完成關(guān)閉或遷移。比如,使用VI client、通過SSH登錄到服務(wù)控制臺或者使用可替代的/緊急的控制臺(通過按Alt+F2到F6)。當(dāng)VM被遷移或者關(guān)閉之后,你可以使用reboot命令重啟ESX,如果所有的控制臺都沒有響應(yīng),你就只能去按主機上的電源按鈕,冷啟動主機。
網(wǎng)絡(luò)問題
有時,你也會遇到某種故障導(dǎo)致丟失了所有或者部分的網(wǎng)絡(luò)配置,或者網(wǎng)絡(luò)配置改變導(dǎo)致服務(wù)控制臺丟失網(wǎng)絡(luò)連接。當(dāng)服務(wù)控制臺的網(wǎng)絡(luò)連接丟失時,你將無法使用遠程的方法來連接ESX主機,包括VI client和SSH。你只能在本地的服務(wù)控制臺上使用esxcfg-命令行工具恢復(fù)/修正網(wǎng)絡(luò)配置,以下是一些命令,你可以從ESX CLI上使用它們配置網(wǎng)絡(luò):
esxcfg-nics
這個命令顯示物理網(wǎng)卡列表,除去每個網(wǎng)卡的驅(qū)動信息、PCI設(shè)備、鏈接狀態(tài),你可以使用這個命令控制物理網(wǎng)卡的速度、雙工模式等。esxcfg-nics –l顯示網(wǎng)卡信息、esxcfg-nics –h顯示該命令可用的選項,以下是一些例子:
o設(shè)置物理網(wǎng)卡vmnic2的速度和雙工模式為100/Full:
esxcfg-nics -s 100 -d full vmnic2
o設(shè)置物理網(wǎng)卡vmnic2的速度和雙工模式為自適應(yīng)模式:
esxcfg-nics -a vmnic2
esxcfg-vswif
創(chuàng)建或者更新服務(wù)控制臺網(wǎng)絡(luò),包括IP地址和端口組,esxcfg-vswif –l顯示當(dāng)前設(shè)置、esxcfg-vswif –h顯示可用的選項,以下是一些例子:
o更改服務(wù)控制臺(vswif0)IP地址和子網(wǎng)掩碼:
esxcfg-vswif -i 172.20.20.5 -n 255.255.255.0 vswif0
o添加服務(wù)控制臺(vswif0):
esxcfg-vswif -a vswif0 -p "Service Console" -i 172.20.20.40 -n 255.255.255.0
esxcfg-vswitch
創(chuàng)建或者更新虛擬機網(wǎng)絡(luò)(vSwitch) ,包括上行鏈路、端口組和VLAN ID. 輸入esxcfg-vswitch –l顯示當(dāng)前的vSwitch、 esxcfg-vswitch –h顯示所有可用的選項. 以下是一些例子:
o將物理網(wǎng)卡(vmnic2) 添加到vSwitch (vSwitch1):
esxcfg-vswitch -L vmnic2 vswitch1
o將物理網(wǎng)卡(vmnic3)從一個vSwitch (vSwitch0)上移除:
esxcfg-vswitch -U vmnic3 vswitch0
o在vSwitch (vSwitch1)上添加一個端口組(VM Network3):
esxcfg-vswitch -A "VM Network 3" vSwitch1
o在vSwitch (vSwitch1)上給端口組(VM Network 3)分配一個VLAN ID(3):
esxcfg-vswitch -v 3 -p "VM Network 3" vSwitch1
esxcfg-route
設(shè)置或提取缺省的VMkernel網(wǎng)關(guān)路由。輸入esxcfg-route –l當(dāng)前的路由信息、esxcfg-route -h顯示所有可用的選項. 以下是一些例子:
o設(shè)置缺省的VMkernel網(wǎng)關(guān)路由:
esxcfg-route 172.20.20.1
o添加一個路由到VMkernel:
esxcfg-route -a default 255.255.255.0 172.20.20.1
esxcfg-vmknic
為VMotion、NAS和iSCSI創(chuàng)建或者更新VMkernel TCP/IP設(shè)置。輸入esxcfg-vmknic –l顯示VMkernel NICs、esxcfg-vmknic -h顯示所有可用的選項. 以下是一些例子:
o添加一個VMkernel NIC并設(shè)定IP和子網(wǎng)掩碼:
esxcfg-vmknic -a "VM Kernel" -i 172.20.20.19 -n 255.255.255.0
另外,你可以通過service network restart命令重啟服務(wù)控制臺網(wǎng)絡(luò)。
其他問題
有時,重啟某些ESX服務(wù)既可解決問題且不影響VM的運行。兩個可以被重啟、并可經(jīng)常解決問題的服務(wù)是hostd和vpxa。運行在服務(wù)控制臺中的Hostd服務(wù)負責(zé)管理ESX上的大部分操作,要重啟hostd服務(wù),登入服務(wù)控制臺,輸入service mgmt-vmware restart。
vpxa服務(wù)是管理代理,用于處理主機和客戶端之間的通訊,客戶端包括vCenter Server和任何連接到ESX的VI client。如果在vCenter Server上看到某個主機顯示disconnected但沒有顯示當(dāng)前信息,或者,任何其他的涉及到vCenter Server和一個主機的奇怪的問題,都可以通過重啟vpxa服務(wù)來解決。要啟動該服務(wù),登入服務(wù)控制臺,輸入service vmware-vpxa restart。當(dāng)你遇到問題時,推薦你重啟這兩個服務(wù),因為,重啟它們經(jīng)常可以解決很多問題。
新聞標(biāo)題:如何解決VMwareESX中出現(xiàn)的常見問題?
分享地址:http://m.5511xx.com/article/djdejoh.html


咨詢
建站咨詢
