Exchange 2016, MAPI/HTTP und der Performance von Outlook in "Online-mode"

  • Hallo!


    Ja, 17.000 Mailboxen auf 8 Servern, keine Virtualisierung. Das Teaming verwendet man zur besseren Netzwerkperformance und zur Redundanz (jeder Path geht über andere Switche).


    Grüße
    Rolf

  • Der First Level Support hat erst mal aufgegeben; ich glaube aber mittlerweile daß das Problem mit dem Netzwerkkarten/Teamingproblem korreliert (Event ID 16949/16950). Auffällig ist daß praktisch nur Outlook-Online-User klagen (also Outlook ohne Cache). Hier vor allem sporadisch auftretende Verzögerungen und Abbrüche.


    Aktuell haben wir vor allem den Wert für TCPKeepAlive gesetzt, das Swapfile nach M$-Empfehlungen eingestellt und das Hyperthreading abgeschaltet.
    Ob das die Performance wirklich beeinflußt werden wir erst in 1, 2 Wochen merken wenn wieder alle User aus dem Urlaub zurück sind und das Exchange richtig unter Last setzen.


    Mittlerweile haben wir einen weiteren Support Case eröffnet der sich mit dem 16949-Problem beschäftigt. Unsere Server Admins finden nach meinem Hinweis die selben Fehler auch auf anderen Maschinen mit hoher Last (z.B. DPM) - könnte also damit enden daß HP mit ins Boot muß.

  • Hi Rolf,
    wäre es möglich, dass Teaming mal für 1-2 Wochen zu deaktivieren? Einfach um die Komplexität runterzudrehen.


    Wegen der Redundanz:
    Ich denke doch, dass die anderen Server ohne Probleme die Last übernehmen können, sollte eine Netzwerkkarte ausfallen. Oder ist es wegen den Switchen?
    Ciao,
    Ingo

  • Es gibt Neuigkeiten. Unsere Netzwerker sind bereit bei 7 der 8 Maschinen mal das Teaming von "LACP" auf "Static" umzustellen. Auf einer Maschine bleibt alles wie es ist, damit wir das Problem für Microsoft weiter reproduzieren können. Aktuell wird erst mal nur eine Maschine auf "Static" umgestellt; wenn das funktioniert, kommen die anderen 6 dran.


    Für mich spannend ist nun ob


    a) Exchange die Änderung überlebt :D
    b) die Event ID 16949 nun weg sind
    c) die Probleme mit Outlook Online und die Performanceprobleme dadurch verschwinden

  • Switch Intependent (auf Windows-Seite) ist laut meinen Netzwerkern das äquivalent für Static (auf Cisco-Seite). Das Verhalten ist aber so gewesen daß bis zu einer gewissen Belastung (Clients) keine Probleme auftraten, ab einer bestimmten Last dann jedoch die Netzwerkkarte immer mal wieder die Verbindung trennt und gleich wieder aufbaut.

  • Eine Maschine haben wir gestern umgestellt. Bis eben traten keine 16949 mehr auf - nun kamen aber ein paar (allerdings bisher signifikant weniger als vorher). Es bleibt spannend!

  • Es gibt Neuigkeiten!


    Microsoft hat zu diesem Problem einen Hotfix: kb3109099


    Anscheinend kann sich der Cisco verhakeln weil Windows 2012 nur "schnelle" LACP-Timer verwendete. Wir haben nur den im Hotfix beschriebenen Registry-Key für "Slow Timer" eingetragen, nicht (!) den Hotfix eingespielt - und voila: die Event ID 16949 sind fast ganz verschwunden (vorher: alle 1-2 Minuten; jetzt: 1-2 Einträge am Tag).