نمایش نتایج: از شماره 1 تا 8 از مجموع 8
سپاس ها 3سپاس
  • 1 توسط SADEGH65
  • 2 توسط VMwares

موضوع: چند سوال در مورد عملکرد HA در کلاستر

  
  1. #1
    نام حقيقي: احمد یزدانی (Poker)

    عضو ویژه شناسه تصویری A.Yazdani
    تاریخ عضویت
    Aug 2010
    محل سکونت
    Isfahan
    نوشته
    946
    سپاسگزاری شده
    1312
    سپاسگزاری کرده
    430
    نوشته های وبلاگ
    8

    چند سوال در مورد عملکرد HA در کلاستر

    سلام

    فرض کنیم در کلاستر 3 هاست داریم و HA رو روی این کلاستر فعال میکنیم.
    هر هاست با استفاده از یک vmkernel به switch بالا دستی متصل شده است مسلما روی همین پورت با Master حرف میزند.
    در حالت عادی اگر mgmt nic هاست slave غیر فعال شود slave بعد از اینکه فهمید ایزولیت شده است مقدار host-x-power-on را در datastore تغییر می دهد و master بعداز چک کردن این مقدار یک فایل دیگر در datastore را تغییر میدهد و این نشان دهنده فعال بودن master هست و حالا هاست slave میتواند isolation response رو انجام بده .

    سوال زمانی پیش میاد که اگر switch بالا دستی قطع شود چه اتفاقی می افتد ؟ در این حالت هم master ارتباطش رو با شبکه از دست میده اما هنوز با استفاده از datastore heartbeat برای بالا آوردن vm ها اعلام آمادگی میکنه .در اینجا اگر slave ماشین هاش رو به امید master خاموش کنه چه اتفاقی خواهد افتاد ؟! آیا برداشت من از روال کار درست است ؟
    ممنونم.



    موضوعات مشابه:

  2. #2
    نام حقيقي: احمد یزدانی (Poker)

    عضو ویژه شناسه تصویری A.Yazdani
    تاریخ عضویت
    Aug 2010
    محل سکونت
    Isfahan
    نوشته
    946
    سپاسگزاری شده
    1312
    سپاسگزاری کرده
    430
    نوشته های وبلاگ
    8
    دوستان و اساتید WMware ...



  3. #3
    نام حقيقي: صادق نجاتی زاده

    مدیر بازنشسته شناسه تصویری SADEGH65
    تاریخ عضویت
    Nov 2003
    محل سکونت
    تهران
    نوشته
    2,264
    سپاسگزاری شده
    3415
    سپاسگزاری کرده
    3619
    نوشته های وبلاگ
    12
    نقل قول نوشته اصلی توسط A.Yazdani نمایش پست ها
    سلام

    فرض کنیم در کلاستر 3 هاست داریم و HA رو روی این کلاستر فعال میکنیم.
    هر هاست با استفاده از یک vmkernel به switch بالا دستی متصل شده است مسلما روی همین پورت با Master حرف میزند.
    در حالت عادی اگر mgmt nic هاست slave غیر فعال شود slave بعد از اینکه فهمید ایزولیت شده است مقدار host-x-power-on را در datastore تغییر می دهد و master بعداز چک کردن این مقدار یک فایل دیگر در datastore را تغییر میدهد و این نشان دهنده فعال بودن master هست و حالا هاست slave میتواند isolation response رو انجام بده .

    سوال زمانی پیش میاد که اگر switch بالا دستی قطع شود چه اتفاقی می افتد ؟ در این حالت هم master ارتباطش رو با شبکه از دست میده اما هنوز با استفاده از datastore heartbeat برای بالا آوردن vm ها اعلام آمادگی میکنه .در اینجا اگر slave ماشین هاش رو به امید master خاموش کنه چه اتفاقی خواهد افتاد ؟! آیا برداشت من از روال کار درست است ؟
    ممنونم.
    سلام
    من درست منظور شما را متوجه نشدم ولی تا جایی که متوجه شدم شما بحث datastore heartbeat را فقط گفتید در صورتی که در ha این یکی از موارد این می باشد و مورد دیگر heartbeat بر اساس شبکه ارتباطی host ها است.

    https://pubs.vmware.com/vsphere-50/i...EF883BC8D.html


    mavrick سپاسگزاری کرده است.

  4. #4
    نام حقيقي: احمد یزدانی (Poker)

    عضو ویژه شناسه تصویری A.Yazdani
    تاریخ عضویت
    Aug 2010
    محل سکونت
    Isfahan
    نوشته
    946
    سپاسگزاری شده
    1312
    سپاسگزاری کرده
    430
    نوشته های وبلاگ
    8
    فرمایش شما درسته اما منظور من زمانی هست که heartbeat دیگه ارسال نمیشه (Switch متصل به سرور ها از دست رفته ) حالا اینجا از طریق database heartbeat از وضعیت هم با خبر میشن و هم slave و هم master تغیررات مورد نیاز در فایل ها رو اعمال می کنند بعد از اینکه slave فهمید که master میتونه سیستم هاش رو بالا بیاره (مطمئن شد از حضور master ) می تونه isolation response رو انجام بده. به فرض اینکه در اونجا تعریف شده باشه power off سیستم ها رو خاموش می کنه , از اون طرف هم master نمیتونه این سیستم ها رو Restart کنه (چون اون هم اتصال به شبکه رو از دست داده ) حالا تکلیف چیه ؟



  5. #5
    نام حقيقي: Hossein Meshkati

    خواننده شناسه تصویری mavrick
    تاریخ عضویت
    May 2010
    محل سکونت
    اصفهان
    نوشته
    561
    سپاسگزاری شده
    308
    سپاسگزاری کرده
    848
    نقل قول نوشته اصلی توسط A.Yazdani نمایش پست ها
    فرمایش شما درسته اما منظور من زمانی هست که heartbeat دیگه ارسال نمیشه (Switch متصل به سرور ها از دست رفته ) حالا اینجا از طریق database heartbeat از وضعیت هم با خبر میشن و هم slave و هم master تغیررات مورد نیاز در فایل ها رو اعمال می کنند بعد از اینکه slave فهمید که master میتونه سیستم هاش رو بالا بیاره (مطمئن شد از حضور master ) می تونه isolation response رو انجام بده. به فرض اینکه در اونجا تعریف شده باشه power off سیستم ها رو خاموش می کنه , از اون طرف هم master نمیتونه این سیستم ها رو Restart کنه (چون اون هم اتصال به شبکه رو از دست داده ) حالا تکلیف چیه ؟
    با عرض معذرت از همه دوستان
    من فقط جهت یادگیری خودم میپرسم
    من اصن نفهمیدم چی شد !!!
    میشه یکمی اقای یزدانی عزیز بیشتر توضیح بدی که سوالت چیه
    یکمی گنگه ، یا یه مدلی دیگه سوالتون و بپرسید ؟!



  6. #6
    نام حقيقي: Amir Fouladvand

    عضو ویژه
    تاریخ عضویت
    Nov 2010
    محل سکونت
    Arak
    نوشته
    644
    سپاسگزاری شده
    807
    سپاسگزاری کرده
    270
    سلام
    به طور کلی هاست ها gateway خودشون رو به عنوان یک نود برای Host Isolation پینگ میکنن و اگر پینگ قطع بشود ولی هاست سالم باشد، در این صورت هاست متوجه میشود که دیگر اعضای کلاستر تصور میکنن که هاست مذکور Down شده است و با استفاده از HA سعی میکنن که ماشین های مستقر در هاست معیوب رو رجیستر کنن و روشن کنن. در حالت عادی این امکان وجود نداره چون فایل های ماشین های مورد بحث توسط هاستی که ارتباطش رو از دست داده Locked هستن. در این حالت فرایند Host Isolation عمل میکنه و هاست به طور اتوماتیک طبق تعریف انجام شده عمل میکنه (که به صورت پیش فرض Power Off هستش) و این باعث میشه که فایل ها آزاد بشن و هاست های باقی مونده در کلاستر بتونن اون ها رو روشن کنن.
    تا اینجا که در مورد HA و Host isolation همه چیز شفاف هست.
    ولی برسیم به موقعی که Switch بالا دستی که هاست ها رو به Gateway (عموما Core Switch) متصل میکنه دچار مشکل میشه مثلا هنگ میکنه.
    در این حالت هر هاست تصور میکنه که ارتباط خودش با شبکه قطع شده و فرایند Host Isolation رو فعال میکنه که بقیه هاست ها بتونن ماشین ها رو روشن کنن (در حالیکه نمیدونه همین اتفاق هم برای بقیه افتاده) و نتیجه اون هم کاملا روشنه، تمام ماشین ها ناگهان خاموش میشن!!!
    به همین دلیل شما باید از بیش از یک Switch در زیرساخت استفاده کنین. همچنین در مواردی که Maintenance دارین و فکز میکنین ممکنه موردی پیش بیاد که همه هاست ها رو درگیر Isolation کنه، میتونین در تنظیمات کلاستر، Host Isolation رو به صورت موقتی غیر فعال کنید و پس از تموم شدن کارتون با شبکه مجددا اون رو فعال کنید.


    ویرایش توسط VMwares : 2014-11-09 در ساعت 04:34 PM
    mavrick و A.Yazdani سپاسگزاری کرده‌اند.

  7. #7
    نام حقيقي: احمد یزدانی (Poker)

    عضو ویژه شناسه تصویری A.Yazdani
    تاریخ عضویت
    Aug 2010
    محل سکونت
    Isfahan
    نوشته
    946
    سپاسگزاری شده
    1312
    سپاسگزاری کرده
    430
    نوشته های وبلاگ
    8
    خوب من یکم بیشتر توضیح میدم :

    در VSphere 5 دونوع Heartbeat وجود داره ,اولی همون network Heartbeat و دومی هم Datastore heartbeat هست.
    اولی که بین هر هاست و Master فرستاده میشه که طبق اون MAster متوجه میشه اون هاست فرستنده در حال کار هست و هیچ مشکلی نداره .
    دومی هم به Master اجازه میده وضعیت یک Host که از طریق Mgmt nic قابل دسترس نیست رو بررسی کنه .

    Isolation هم که می دونیم چه زمانی اتفاق می افته : وقتی یک هاست نتونه با Master ارتباط برقرار کنه و نتونه آدرس مشخص شده که به صورت دیفالت همون GW هست رو ping کنه . بعد تعیین میکنیم که اگه Isolate شدی چه رفتاری انجام بده :
    leave power on
    shut down
    power off

    از کتاب Mastering vsphere 5.1

    کد:
    With vSphere 5, the process for determining if a host is isolated is only slightly different. A host 
    that is the master is looking for communication from its slave hosts; a host that is running as a 
    slave is looking for updates from the master host. In either case, if the master or slave is not 
    receiving any vSphere HA network heartbeat information, it will then attempt to contact the 
    isolation address (by default, the default gateway on the management network). If it can reach the 
    default gateway, then the ESXi host considers itself to be in a network partition state If the host can’t 
    reach the isolation address, then it considers itself isolated.

    و در ادامه :
    کد:
    At this point, an ESXi host that has determined it is network-isolated will modify a special bit in 
    the binary host-X-poweronfile on all datastores that are configured for datastore heartbeating 
    
    
    The master sees that this bit, used to denote isolation, has been set and is therefore notified that this 
    slave host has been isolated. When a master sees that a slave has been isolated, the master locks 
    another file used by vSphere HA on the heartbeat datastore. When the isolated node sees that this 
    file has been locked by a master, it knows that the master is assuming responsibility for restarting 
    the VMs — remember that only a master can restart VMs — and the isolated host is then free to 
    execute the configured isolation response. Therefore, even if the isolation response is set to Shut 
    Down or Power Off, that action won’t take place until the isolated slave has confirmed, via the 
    datastore heartbeating structures, that a master has assumed responsibility for restarting the VMs.

    پس وقتی هاست isolate شده متوجه شد که یک Master وجود دارد میره سراغ اجرا کردن Isolation response time.

    برای تاکید بیشتر
    کد:
    When the isolated node sees that this 
    file has been locked by a master, it knows that the master is assuming responsibility for restarting 
    the VMs and the isolated host is then free to 
    execute the configured isolation response. Therefore, even if the isolation response is set to Shut 
    Down or Power Off, that action won’t take place until the isolated slave has confirmed, via the 
    datastore heartbeating structures, that a master has assumed responsibility for restarting the VMs.
    بعد از اینها حالا سوال اولم ...

    - - - ادامه - - -

    آقای فولاد وند هم تشریف اوردن )



  8. #8
    نام حقيقي: احمد یزدانی (Poker)

    عضو ویژه شناسه تصویری A.Yazdani
    تاریخ عضویت
    Aug 2010
    محل سکونت
    Isfahan
    نوشته
    946
    سپاسگزاری شده
    1312
    سپاسگزاری کرده
    430
    نوشته های وبلاگ
    8
    خوب جواب سوال اول رو گرفتیم "همه ماشین ها همزمان خاموش میشوند" .
    یه سوال دیگه :
    در بعضی از داکیومت ها دیدم که میگن در صورت قطع ارتباط یک هاست با Master ممکنه که دو نسخه از VM اجرا بشه.
    برای مثال از VMware vSphere High Availability 5.0 Best Practices


    کد:
    In environments that use only network-based storage protocols,such as iSCSI and NFS,and those that share
    physical network components between the management and storage traffic,the recommended isolation response is Power Off.With these environments, it is likely that a network outage causing a host	to become
    isolated will also affect the host’s ability to communicate to the datastores. If the host lost access to the
    datastores, a master HA agent would be able to power on a second instance of any virtual machine while the 
    first is still running on the isolated host. This situation might be problematic if both instances of the virtual 
    machine retain access	to the virtual machine	network.The Power Off isolation	response recommendation
    reduces the impact of this issue by having the isolated HA agent power off the virtual machines on the 
    isolated host.
    در این متن گفته شده است که در صورتیکه Storage از نوع iscsi باشه و ترافیک Mgmt و ترافیک Storage از یک VMNIC عبور کند این مشکل ممکن است اتفاق بیفتد. خودش پیشنهاد میده power off کنیم . خوب اگه ارتباط یک هاست با datastore قطع بشه چه هاست اون ماشین رو خاموش کنه و چه بگذاره روشن باشه Datastore از کجا خواهد فهمید که هاست دستور خاموش دادن رو داده که بخواد خاموشش کنه و اجازه بده Master روشن کنه ؟



کلمات کلیدی در جستجوها:

هیچ کلمه ای ثبت نشده است.

برچسب برای این موضوع

مجوز های ارسال و ویرایش

  • شما نمی توانید موضوع جدید ارسال کنید
  • شما نمی توانید به پست ها پاسخ دهید
  • شما نمی توانید فایل پیوست ضمیمه کنید
  • شما نمی توانید پست های خود را ویرایش کنید
  •