캐시 옵션이 있는 새 디스크를 추가하면 동일한 캐시 디스크를 사용하는 다른 스토리지 디스크에 오류가 발생합니다 팔로우
증상
1. 노드의 새 디스크에 스토리지 역할과 캐싱 및 체크섬에 SSD 사용 옵션이 할당되었습니다.
2. 새 디스크가 "활성"상태로 표시된 후 캐시에 SSD를 사용하도록 구성된 다른 모든 디스크는 "실패"상태로 남아 있습니다.
[root@node01 ~]# vstorage -c cluster1 list-services
TYPE ID ENABLED STATUS DEVICE/VOLUME GROUP DEVICE INFO PATH
CS 1029 enabled failed /dev/sdd1 ATA TOSHIBA HDWN160 /vstorage/9905d6a0/cs
CS 1030 enabled failed /dev/sdc1 ATA TOSHIBA HDWN160 /vstorage/01608bad/cs
CS 1038 enabled failed /dev/sde1 ATA INTEL SSDSC2KB48 /vstorage/156c23d5/cs
CS 1047 enabled active[29463] /dev/sdf1 ATA TOSHIBA MG07ACA1 /vstorage/6c3918e5/cs
MDS 3 enabled active[2702] /dev/sdb1 ATA Crucial_CT512MX1 /vstorage/a09ea656/mds
3. could not lock repository 발행 된 CS에 대한 최신 메시지의 다음 동작 패턴은 클러스터 이벤트별로 볼 수 있습니다.
[root@node01 ~]# vstorage -c cluster1 get-events
...
2019-11-28 12:42:10.987 MON INF: CS#1038 was stopped: csd: could not lock repository
2019-11-28 12:42:11.325 MON INF: CS#1030 was stopped: csd: could not lock repository
2019-11-28 12:42:11.325 MON INF: CS#1029 was stopped: csd: could not lock repository
2019-11-28 12:42:43.588 MDS INF: New CS#1047 at 192.168.1.101:48408 (0.0.0.4b11ac89f7274355), tier=0
2019-11-28 12:42:45.199 MDS INF: CS#1047 is active
...
2019-11-28 12:56:55.276 MDS WRN: CS#1029 is offline
2019-11-28 12:56:56.276 MDS WRN: CS#1038, CS#1030 are offline
4. 영향을 받는 모든 CS는 동일한 캐시 디스크( /dev/sdb1 이 예에서는 디스크)에 저널이 있습니다.
[root @ node01 ~] # ll / vstorage / a09ea656 / journal / journal-cs-10 * / journal
-rw ------- 1 vstorage vstorage 90798297088 11 월 28 일 13:27 / vstorage / a09ea656 / journal / journal-cs-1029 / journal
-rw ------- 1 vstorage vstorage 90798297088 11 월 28 일 13:28 / vstorage / a09ea656 / journal / journal-cs-1030 / journal
-rw ------- 1 vstorage vstorage 90798297088 11 월 28 일 13:12 / vstorage / a09ea656 / journal / journal-cs-1038 / journal
-rw ------- 1 vstorage vstorage 90932514816 11 월 28 일 13:28 / vstorage / a09ea656 / journal / journal-cs-1047 / journal
원인
소프트웨어 관련 문제로 인해 캐시 저널 재구성 후 vstorage-csd 서비스가 '실패'상태로 유지됩니다.
해결 방법
이 문제는 Acronis Cyber Infrastructure 4.0에서 수정되었습니다.
이전 버전의 경우 : 문제를 해결하려면 다음 명령을 사용하여 영향을 받는 노드에서 모든 vstorage-csd 서비스를 수동으로 다시 시작해야 합니다.
# (export CN=$(cat /mnt/vstorage/.vstorage.info/clustername); for i in $(vstorage -c $CN list-services | grep 'CS.*failed'| awk '{print$2}'); do systemctl restart vstorage-csd.$CN.$i.service; done)
참조 - https://kb.acronis.com/content/64145