新聞中心
在集群計算中,RAC(Real Application Clusters)是一種常見的方案,用于提高系統(tǒng)可靠性和效率。然而,就像任何其他軟件一樣,RAC也可能出現(xiàn)故障。在Linux環(huán)境中,如果RAC出現(xiàn)故障,應(yīng)該如何快速解決呢?本文將介紹一些解決故障的方法。

創(chuàng)新互聯(lián)專注于企業(yè)網(wǎng)絡(luò)營銷推廣、網(wǎng)站重做改版、簡陽網(wǎng)站定制設(shè)計、自適應(yīng)品牌網(wǎng)站建設(shè)、H5網(wǎng)站設(shè)計、商城系統(tǒng)網(wǎng)站開發(fā)、集團(tuán)公司官網(wǎng)建設(shè)、外貿(mào)營銷網(wǎng)站建設(shè)、高端網(wǎng)站制作、響應(yīng)式網(wǎng)頁設(shè)計等建站業(yè)務(wù),價格優(yōu)惠性價比高,為簡陽等各大城市提供網(wǎng)站開發(fā)制作服務(wù)。
故障排查
當(dāng)RAC出現(xiàn)故障時,首先要做的是排查問題,找出故障原因。
1.日志
查看系統(tǒng)日志。Linux的系統(tǒng)日志位于/var/log目錄下,一些關(guān)鍵的日志文件包括messages、kernel和syslog。通過查看這些日志,可以發(fā)現(xiàn)一些系統(tǒng)錯誤信息,從而找出引起RAC故障的原因。
2.服務(wù)狀態(tài)
使用命令systemctl status查看RAC相關(guān)的服務(wù)狀態(tài)。例如,如果使用Oracle RAC,則可以查看oraclea、oracledb和nodeagent等服務(wù)的狀態(tài)。如果某個服務(wù)無法正常啟動,就可能是RAC出現(xiàn)了問題。
3.網(wǎng)絡(luò)連接
檢查網(wǎng)絡(luò)連接是否正常。在RAC中,節(jié)點之間的通信非常重要。如果節(jié)點之間的網(wǎng)絡(luò)連接中斷或者延遲過大,就會導(dǎo)致RAC故障。可以使用命令ping或者telnet來測試節(jié)點之間的網(wǎng)絡(luò)連接狀態(tài)。同時,也要檢查防火墻的設(shè)置,確??梢哉Mㄐ?。
解決方法
當(dāng)找到RAC故障的根本原因之后,就可以采取相應(yīng)的解決方法了。
1.重啟服務(wù)
如果某個服務(wù)出現(xiàn)了問題,可能只需要重啟服務(wù)即可解決。可以使用命令systemctl restart service_name來重啟服務(wù)。
2.更新軟件包
有時候,RAC故障是由于軟件包版本過舊導(dǎo)致的??梢允褂妹顈um update來升級軟件包。
3.修復(fù)文件系統(tǒng)
當(dāng)文件系統(tǒng)損壞時,也可能導(dǎo)致RAC故障。此時,可以使用命令fsck檢查和修復(fù)文件系統(tǒng)。
4.重新設(shè)置系統(tǒng)時間
如果系統(tǒng)時間不正確,也可能導(dǎo)致RAC故障。可以使用命令date來查看和設(shè)置系統(tǒng)時間。
5.調(diào)整內(nèi)存和CPU
RAC需要足夠的內(nèi)存和CPU資源才能正常運行。如果內(nèi)存或CPU不足,就可能導(dǎo)致RAC故障。例如,可以使用命令top來查看系統(tǒng)資源使用情況,并且根據(jù)需要調(diào)整系統(tǒng)配置。
RAC故障可能會導(dǎo)致系統(tǒng)崩潰、數(shù)據(jù)丟失等問題,因此必須及時發(fā)現(xiàn)和解決。在Linux環(huán)境中,排查RAC故障的方法包括查看日志、檢查服務(wù)狀態(tài)和網(wǎng)絡(luò)連接等。解決方法包括重啟服務(wù)、更新軟件包、修復(fù)文件系統(tǒng)、重新設(shè)置系統(tǒng)時間和調(diào)整內(nèi)存和CPU等。只有通過實踐和不斷探索,才能更好地解決RAC故障問題,提高Linux系統(tǒng)的可靠性和效率。
成都網(wǎng)站建設(shè)公司-創(chuàng)新互聯(lián),建站經(jīng)驗豐富以策略為先導(dǎo)10多年以來專注數(shù)字化網(wǎng)站建設(shè),提供企業(yè)網(wǎng)站建設(shè),高端網(wǎng)站設(shè)計,響應(yīng)式網(wǎng)站制作,設(shè)計師量身打造品牌風(fēng)格,熱線:028-86922220linux系統(tǒng)重啟網(wǎng)卡后網(wǎng)絡(luò)不通(NetworkManager篇)
個人博客:點擊這里進(jìn)入
一.故轎逗障現(xiàn)象
RHEL7.6系統(tǒng),使用nmcli綁定雙網(wǎng)卡閉唯賣后,再使用以下命令重啟network服務(wù)后主機(jī)網(wǎng)絡(luò)異常,導(dǎo)致無法通過ssh遠(yuǎn)程登錄系統(tǒng)。
# systemctl restart network
二.理論知識
Network service的制御網(wǎng)絡(luò)接口配置信息改動后,網(wǎng)絡(luò)服務(wù)必須從新啟動,來激活網(wǎng)絡(luò)新配置的使得配置生效,這部分操作和從新啟動系統(tǒng)時時一樣的作用。制御(控制)是/etc/init.d/network這個文件,可以用這個文件后面加上下面的參數(shù)來操作網(wǎng)絡(luò)服務(wù)。例如:
# /etc/init.d/network restart
同樣也可以用service這個命令來操作網(wǎng)絡(luò)服務(wù)例如:
# service network restart
# systemctl restart network (NetworManager)是檢測網(wǎng)絡(luò)、自動連接網(wǎng)絡(luò)的程序。無論是無線還是有線連接,它都可以令您輕松管理。對于
無線網(wǎng)絡(luò)
,網(wǎng)絡(luò)管理器可以自動切換到最可靠的無線網(wǎng)絡(luò)。利用網(wǎng)絡(luò)管理器的程序可以自由切換在線和
離線模式
。網(wǎng)絡(luò)管理器可以優(yōu)先選擇有線網(wǎng)絡(luò),支持 VPN。網(wǎng)絡(luò)管理器最初由 Redhat 公司開發(fā),現(xiàn)在由 GNOME 管理
三.環(huán)境分析
系統(tǒng)版本:Red Hat Enterprise Linux Server release 7.6
內(nèi)核
版本:3.10.0-957.el7.x86_64
硬件類型:Huawei 2288H V5
首先檢查系統(tǒng)網(wǎng)絡(luò)配置,該系統(tǒng)配置兩塊bonding設(shè)備,分別是:
bond0:業(yè)務(wù)網(wǎng)絡(luò)
bond1:
Oracle RAC
心跳網(wǎng)絡(luò) 分析
系統(tǒng)日志
,當(dāng)重啟network服務(wù)時(systemctl restart network),系統(tǒng)messages日志中無明顯異常,測試發(fā)現(xiàn),當(dāng)停止NetworkManager服務(wù)后,問題現(xiàn)象消失,即執(zhí)行如下操作:
# systemctl stop NetworkManager
此時再次重啟network服務(wù):
# systemctl restart network
可以很快ping通山亂bond0的業(yè)務(wù)地址10.116.6.194。 進(jìn)一步分析發(fā)現(xiàn),如果不停止NetworkManager服務(wù),而是修改網(wǎng)卡
配置文件
,在bonding網(wǎng)卡和組成bonding的slave網(wǎng)卡的配置文件中增加一行配置,也可以解決該問題。
NM_CONTROLLED=no
參考
紅帽
RHEL7配置網(wǎng)卡bonding的官方文檔:
可以看到,官方文檔的配置示例中設(shè)置了NM_CONTROLLED=”no”:
” align=”center”>
四.原廠問題建議
該問題是由于NetworkManager服務(wù)引起,可以通過如下兩種方法解決:
在網(wǎng)卡配置文件中增加參數(shù)NM_CONTROLLED=no(“no”的引號可以不寫),設(shè)置后重啟network服務(wù)生效。設(shè)置NM_CONTROLLED=no的目的是將
網(wǎng)絡(luò)設(shè)備
脫離NetworkManager服務(wù)的管理,設(shè)置后該網(wǎng)絡(luò)設(shè)備僅由network服務(wù)管理,不受NetworkManager服務(wù)控制,因而nmcli命令對該網(wǎng)絡(luò)設(shè)備不再生效;
停止并禁用NetworkManager服務(wù),停用后所有網(wǎng)絡(luò)設(shè)備由network服務(wù)管理,不能通過nmcli命令來管理網(wǎng)絡(luò)設(shè)備:
# systemctl stop NetworkManager
# systemctl disable NetworkManager
五.解決方案
據(jù)上所述,可關(guān)閉NetworkManager服務(wù)或在BOND配置文件中添加參數(shù),但因環(huán)境需要,需使用nmcli命令,故無法關(guān)閉NetworkManager,在多輪測試中進(jìn)行思考,既然NetManager與network服務(wù)沖突,但nmcli命令屬于NetworkManager,systemctl一般用來管理network,考慮兩者管理命令可能也存在沖突后進(jìn)行了一波測試,使用NetworkManager的nmcli進(jìn)行網(wǎng)卡的重啟操作,使用以下命令后,網(wǎng)絡(luò)可以即刻ping通并通過SSH連接
# nmcli connection down 網(wǎng)口名稱
# nmcli connection up 網(wǎng)口名稱
六.結(jié)論
因NetworkManager與network服務(wù)存在沖突,且雙網(wǎng)卡綁定時所使用的的nmcli進(jìn)行綁定,nmcli歸屬于NetworkManager,故重啟網(wǎng)卡時應(yīng)用nmcli命令up/down,不應(yīng)使用systemctl進(jìn)行網(wǎng)卡重啟
oracle 11g r2 rac linux下 ntp問題
設(shè)置NTP服務(wù)的目的,是讓構(gòu)建RAC環(huán)境的兩臺機(jī)器的時間保持一致
讓鏈神其中一臺為主,另外的NTP服務(wù)指到該服務(wù)器即可。
在11GR2,新增加了一個CTSS進(jìn)程,專門用于時間同亂清步,因此,需要以下配置
開啟棚陪虧NTPD服務(wù),但必須以-X選項啟動NTP服務(wù)
# /in/service ntpd start
# chkconfig ntpd on
修改文件/etc/sysconfig/ntpd,增加-x 選項
vi /etc/sysconfig/ntpd
—
OPTI
—
之后,必須重新啟動ntp
oracle無法聯(lián)系代理我的ORACLE是 g的企業(yè)版,裝在LINUX服務(wù)器上,兩臺服務(wù)器做了一個RAC集群,
看起來基本都搞定了啦,呵呵
企業(yè)管理器開不起來不是很重要!
你先橡嫌看一下集群是否正常!
su – oracle
srvctl status database -d 你的集群名字
集群的啟動狀態(tài)!
切化到su – grid
crs_stat -t -v
看一下集群的信息
把毀如孝crs_stat -t -v 信息貼出來!
集群啟動的時候需要些時間的!
不要著急!
ps -ef|grep grid 看一下系統(tǒng)的進(jìn)程。
這個時候千纖稿萬不要慌。
關(guān)注,幫他頂起來
關(guān)于linux rac 故障的介紹到此就結(jié)束了,不知道你從中找到你需要的信息了嗎 ?如果你還想了解更多這方面的信息,記得收藏關(guān)注本站。
成都網(wǎng)站建設(shè)選創(chuàng)新互聯(lián)(?:028-86922220),專業(yè)從事成都網(wǎng)站制作設(shè)計,高端小程序APP定制開發(fā),成都網(wǎng)絡(luò)營銷推廣等一站式服務(wù)。
網(wǎng)站標(biāo)題:LinuxRAC出現(xiàn)故障:如何快速解決?(linuxrac故障)
網(wǎng)頁地址:http://m.5511xx.com/article/codjeps.html


咨詢
建站咨詢
