• vmware esxi 5.1 na dell 1950

    From MaRc@110:300/1.1 to All on Tue Jul 2 19:31:19 2013
    Witam
    Postawiłem vmware 5.1 esxi na delu 1950. Co więcej, vmware ściągnąłem z dela, gdyż właśnie ich "przeróbke" rekomenduje. Ogólnie działa, z tym, że mam problem z dostępem do datastore zrobionym na dyskach w delu.
    gdy jakiś system guestowy próbuje cokolwiek zapisać, lub z konsoli ssh w vmware próbując zapisać do datastore1 w logu pojawia się error mówiący, o utraconym dostępie do woluminu.
    #v+
    Lost access to datastore1 due to connectiviti issues.
    #v+
    w systemie guestowym skutkuje to "zacinkami" i bardzo długimi czasami
    zapisu.

    czy ktoś miał kiedykolwiek podobny problem?

    --
    MaRc
    Nie kłóć się z idiotą. Będziesz musiał zniżyć się do jego poziomu a wówczas pobije cię swoimi argumentami.

    --- MBSE BBS v0.95.15 (GNU/Linux-x86_64)
    * Origin: NASK - www.nask.pl (110:300/1.1@linuxnet)
  • From ein@110:300/1.1 to All on Wed Jul 3 01:25:44 2013
    MaRc wrote:
    Witam Postawiłem vmware 5.1 esxi na delu 1950. Co więcej, vmware ściągnąłem z dela, gdyż właśnie ich "przeróbke" rekomenduje.
    Ogólnie działa, z tym, że mam problem z dostępem do datastore
    zrobionym na dyskach w delu. gdy jakiś system guestowy próbuje
    cokolwiek zapisać, lub z konsoli ssh w vmware próbując zapisać do datastore1 w logu pojawia się error mówiący, o utraconym dostępie
    do woluminu. #v+ Lost access to datastore1 due to connectiviti
    issues. #v+ w systemie guestowym skutkuje to "zacinkami" i bardzo
    długimi czasami zapisu.

    czy ktoś miał kiedykolwiek podobny problem?

    Ogólnie wygląda na problem I/O związany z kontrolerem lub dyskami.
    Możesz pokazać smartctl -a /dev/sdX ?

    Zobacz:

    http://serverfault.com/questions/439548/dell-poweredge-r210-running-vmware-esx- 4-1-losing-access-to-local-disks

    i;
    http://www.experts-exchange.com/Software/VMWare/Q_26454093.html

    kopia tego wątku;

    We have a Dell PowerEdge T310 running ESXi v4.0 and two production
    VM's (one Windows Server 2003 and one Ubuntu Linux). All of the
    storage for the server is local in 2 1TB SATA drives. It's been
    running flawlessly for approximately 200 days (since installed) but,
    beginning yesterday, is starting to randomly go offline. In the event
    log for the server, I see a series of messages "Lost access to volume
    <long number> (datastore1) due to connectivity issues. Recovery
    attempt is in progress and outcome will be reported shortly.". This
    error is showing up at random intervals every few minutes on the
    server all of a sudden.


    by: ngmarowaPosted on 2010-09-06 at 05:31:48ID: 33610816

    http://kb.vmware.com/selfservice/microsites/search.do?language=en_US&cmd=displa yKC&externalId=1009557


    by: cybertechcafePosted on 2010-09-06 at 06:10:13ID: 33611041

    Googling now but, is there any way to get to the service console
    remotely (e.g., without having to have hands on the physical console)?


    by: MrN1c3Posted on 2010-09-06 at 06:32:21ID: 33611186

    You cant hit the service console remotely if its running esxi. Do you
    have a DRAC card on your T310?


    by: cybertechcafePosted on 2010-09-06 at 06:46:03ID: 33611266

    To be honest, I'm not sure. I'm not terribly familiar with the
    environment (yet) and am still filling my way around. Looking at
    everything else though, I suspect that the answer is no. If that's my
    only option, looks like it's time for a site visit.


    by: cybertechcafePosted on 2010-09-06 at 07:23:35ID: 33611559

    I believe that a site visit is going to be my best option here (there
    are obviously a few things that I need to discover about the site).
    My plan at this point is the following:

    - Check to make certain that the box has the latest BIOS
    - Check to make certain that the firmware is up-to-date on the box
    - Start it and see if we still see the errors (a lot of what I'm
    seeing seems to indicate that this is either a hardware issue or a
    firmware issue. Since it has been working well for so long and, to my knowledge, there have been no changes, I fear that it's more likely
    hardware than firmware, but I am hoping)
    - If the errors are still there, head down the road below http://kb.vmware.com/selfservice/microsites/search.do?language=en_US&cmd=displa yKC&externalId=1009557
    - My only concern with the link above is that it seems very specific
    to shared storage and fibre channel, but this is an on board RAID
    controller (Dell / PERC) and not a SAN or NAS device.


    by: cybertechcafePosted on 2010-09-06 at 07:51:22ID: 33611787

    The drives on the server are a mirrored. We have another ESXi server
    available that we can use as a stand in while this one is down. I
    would like to be able to copy the VM from the semi-dead ESXi server to
    the stand-in-server but am unable to do so from the datastore browser
    (keep getting I/O errors). Is it possible for me to remove one of the
    drives and, using a USB drive cage or something, mount it in something
    like Linux and just copy the files to the other server? Will Linux be
    able to see the VMFS?

    Removed reference to illegal CD.

    rindi,
    EE ZA Storage


    by: cybertechcafePosted on 2010-09-06 at 08:48:58ID: 33612175

    One other thing that I just noticed is that, from Host ->
    Configuration -> Health and Status, there is a Warning and the status
    of the drive controller seems to be flapping (unknown / normal).


    by: cybertechcafePosted on 2010-09-06 at 08:49:54ID: 33612181

    Also, the box has dual power supplies and the status of both is
    'unknown'. Do not know if that is normally 'normal' or if 'unknown'
    is typical.


    by: cybertechcafePosted on 2010-09-06 at 12:29:34ID: 33613173

    Ok, just an update. We arrived on site to begin the [long, arduous]
    process of recovery and rebooted the server a couple of times in the
    process. On one of these reboots, we noted that the array was in a
    state 'resyncing'. We let ESXi boot and went to the Health Status
    and, this time, noted that the storage controller had a warning and
    one of the drives was in status 'rebuilding'. What was more, both of
    the VM's on the server had started and there were *no* errors. We
    have shut down the VMs and are using the datastore browser to download
    them to another workstation (something that wasn't possible before,
    kept getting I/O errors) and are getting good throughput and no
    errors. At this point, I have *no idea* what has changed on the box
    but it's running very well at the moment and we are moving bits across
    the drive controller with no problems.


    by: cybertechcafePosted on 2010-09-06 at 16:10:59ID: 33614055

    Ok, the initial problem of not having connectivity to the hard drives
    seems to be behind us. At the end of the day, nothing was really done
    to *fix* the problem, it just started working again. We did find that something (still trying to find out what) caused the RAID array
    (mirror) to degrade and, I suspect, that degraded array was a big part
    of the problem (understandably very slow while it was attempting to
    rebuild the array).


    --- MBSE BBS v0.95.15 (GNU/Linux-x86_64)
    * Origin: ATMAN - ATM S.A. (110:300/1.1@linuxnet)
  • From MaRc@110:300/1.1 to All on Wed Jul 3 19:13:02 2013
    On 03.07.2013 01:25, ein wrote:
    Ogólnie wygląda na problem I/O związany z kontrolerem lub dyskami.
    Możesz pokazać smartctl -a /dev/sdX ?


    w samym vmware nie mam dostępnego smartctl'a. mogę pokazać z hosta guesta.

    #v+
    root@dhcps:~# smartctl -a /dev/sda
    smartctl 5.41 2011-06-09 r3365 [x86_64-linux-3.2.0-4-amd64] (local build) Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net

    Vendor: VMware
    Product: Virtual disk
    Revision: 1.0
    User Capacity: 68,719,476,736 bytes [68,7 GB]
    Logical block size: 512 bytes
    Device type: disk
    Local Time is: Wed Jul 3 19:02:47 2013 CEST
    Device does not support SMART

    Error Counter logging not supported
    Device does not support Self Test logging
    root@dhcps:~# cd /tmp/
    root@dhcps:/tmp# dd if=/dev/zero of=test bs=1M count=100
    100+0 przeczytanych recordw
    100+0 zapisanych recordw
    skopiowane 104857600 bajtw (105 MB), 0,26056 s, 402 MB/s
    root@dhcps:/tmp# dd if=/dev/zero of=test bs=1M count=100
    100+0 przeczytanych recordw
    100+0 zapisanych recordw
    skopiowane 104857600 bajtw (105 MB), 7,99286 s, 13,1 MB/s
    root@dhcps:/tmp#
    #v-

    jak widać przy drugiej próbie zapisu mam 13,1MB/s, bywa i w kB/s. Za
    drugim razem w logu vmware
    #v+
    Lost access to volume 51c9905e-9d966a58-38d6-001d09685bd8 (datastore1)
    due to connectivity issues. Recovery attempt is in progress and outcome
    will be reported shortly.
    #v-

    Zobacz:


    http://serverfault.com/questions/439548/dell-poweredge-r210-running-vmware-esx- 4-1-losing-access-to-local-disks


    To jest identyczny problem, z tym, że na tych dyskach do tej pory
    pracował gentoo bez żadnych bolączek. zaraz po instalacji vmware problem się pojawił.
    sprawdzałem dyski dellowskim narzędziem do sprawdzania sprzętu i nie znalazł żadnych błędów :/


    i;
    http://www.experts-exchange.com/Software/VMWare/Q_26454093.html


    tu niestety nie mam konta :/ i nie mogę sobie poczytać



    --
    MaRc
    Nie kłóć się z idiotą. Będziesz musiał zniżyć się do jego poziomu a wówczas pobije cię swoimi argumentami.

    --- MBSE BBS v0.95.15 (GNU/Linux-x86_64)
    * Origin: NASK - www.nask.pl (110:300/1.1@linuxnet)
  • From ein@110:300/1.1 to All on Wed Jul 3 22:37:30 2013
    MaRc wrote:
    On 03.07.2013 01:25, ein wrote:
    Ogólnie wygląda na problem I/O związany z kontrolerem lub
    dyskami. Możesz pokazać smartctl -a /dev/sdX ?


    w samym vmware nie mam dostępnego smartctl'a. mogę pokazać z hosta
    guesta.

    #v+ root@dhcps:~# smartctl -a /dev/sda smartctl 5.41 2011-06-09
    r3365 [x86_64-linux-3.2.0-4-amd64] (local build) Copyright (C)
    2002-11 by Bruce Allen, http://smartmontools.sourceforge.net

    Vendor: VMware Product: Virtual disk
    Revision: 1.0 User Capacity: 68,719,476,736
    bytes [68,7 GB] Logical block size: 512 bytes Device type:
    disk Local Time is: Wed Jul 3 19:02:47 2013 CEST Device
    does not support SMART

    No właśnie najbardziej na SMART mi zależy, bo można w miarę
    jednoznacznie określić "zdrowie" dysków i je wykluczyć.

    Error Counter logging not supported Device does not support Self
    Test logging root@dhcps:~# cd /tmp/ root@dhcps:/tmp# dd
    if=/dev/zero of=test bs=1M count=100 100+0 przeczytanych recordw
    100+0 zapisanych recordw skopiowane 104857600 bajtw (105 MB),
    0,26056 s, 402 MB/s root@dhcps:/tmp# dd if=/dev/zero of=test bs=1M
    count=100 100+0 przeczytanych recordw 100+0 zapisanych recordw
    skopiowane 104857600 bajtw (105 MB), 7,99286 s, 13,1 MB/s
    root@dhcps:/tmp# #v-

    jak widać przy drugiej próbie zapisu mam 13,1MB/s, bywa i w kB/s.
    Za drugim razem w logu vmware #v+ Lost access to volume 51c9905e-9d966a58-38d6-001d09685bd8 (datastore1) due to
    connectivity issues. Recovery attempt is in progress and outcome
    will be reported shortly. #v-

    Zobacz:

    http://serverfault.com/questions/439548/dell-poweredge-r210-running-vmware-esx- 4-1-losing-access-to-local-disks



    To jest identyczny problem, z tym, że na tych dyskach do tej pory
    pracował gentoo bez żadnych bolączek. zaraz po instalacji vmware
    problem się pojawił. sprawdzałem dyski dellowskim narzędziem do sprawdzania sprzętu i nie znalazł żadnych błędów :/


    i;
    http://www.experts-exchange.com/Software/VMWare/Q_26454093.html


    tu niestety nie mam konta :/ i nie mogę sobie poczytać

    Dlatego wkleiłem do poprzedniego posta treść tego wątku.

    Kolejna sprawa, RAID masz sprzętowy, prawda?
    Jaki?
    Jak zachowa się VMWare?
    Spróbuj zmienić cache zapisu na writeback i ew. zainstalować VMware
    bez RAID.
    Jak zachowa się VMWare?



    --- MBSE BBS v0.95.15 (GNU/Linux-x86_64)
    * Origin: ATMAN - ATM S.A. (110:300/1.1@linuxnet)
  • From MaRc@110:300/1.1 to All on Thu Jul 4 00:56:00 2013
    On 03.07.2013 22:37, ein wrote:
    Kolejna sprawa, RAID masz sprzętowy, prawda?

    Tak, dokładnie sprzętowy.

    Jaki?

    PERC6i. 2 dyski sata w mirrorze


    Jak zachowa się VMWare?
    Spróbuj zmienić cache zapisu na writeback i ew. zainstalować VMware
    bez RAID.
    Jak zachowa się VMWare?


    posprawdzam, potestuję.
    generalnie wydaje mi się, że to może być kwestia dysków sata. są to 2T segate baracuda i to te zwykłe nie 24/7.


    --
    MaRc
    Nie kłóć się z idiotą. Będziesz musiał zniżyć się do jego poziomu a wówczas pobije cię swoimi argumentami.

    --- MBSE BBS v0.95.15 (GNU/Linux-x86_64)
    * Origin: NASK - www.nask.pl (110:300/1.1@linuxnet)