<svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 200 150"> <path fill="currentColor" d="M18.8576,61.2329h6.1353V83.272H35.81v5.1665H18.8576Zm25.4678,1.9783a3.0582,3.0582,0,0,1-3.31,3.0675,3.0718,3.0718,0,1,1,.0808-6.1349A3.0341,3.0341,0,0,1,44.3254,63.2112ZM37.9883,88.4385V68.7007H44.124V88.4385Zm9.8069-13.4414c0-2.4619-.0806-4.52-.1613-6.2964h5.3279l.2828,2.7447h.1214a7.0873,7.0873,0,0,1,6.0945-3.1889c4.0366,0,7.0642,2.7047,7.0642,8.5168V88.4385H60.3889V77.5c0-2.5428-.8878-4.2783-3.1076-4.2783a3.37,3.37,0,0,0-3.1489,2.3,4.4215,4.4215,0,0,0-.2014,1.5342V88.4385H47.7952Zm28.5364,2.0184h.0806a26.5651,26.5651,0,0,1,1.4129-2.3812l3.9959-5.9336h7.3864l-7.0636,7.9918,8.0727,11.746H82.6687l-4.8036-8.1133-1.5335,1.9374v6.1759H70.1959V59.78h6.1357Zm18.6473,3.5117c.1615,2.5428,2.7041,3.7539,5.57,3.7539a16.2684,16.2684,0,0,0,5.45-.8477l.8068,4.1574a18.6584,18.6584,0,0,1-7.1441,1.2513c-6.7007,0-10.5354-3.8746-10.5354-10.05,0-5.0051,3.1085-10.5351,9.97-10.5351,6.3779,0,8.8,4.9651,8.8,9.849a14.5983,14.5983,0,0,1-.202,2.4217Zm7.2249-4.1981c0-1.4933-.6455-3.9959-3.471-3.9959-2.5833,0-3.6331,2.3819-3.7944,3.9959ZM129.4482,59.78V82.5455c0,2.22.0808,4.5612.1616,5.893h-5.45l-.2419-2.8659h-.1208a6.8949,6.8949,0,0,1-6.1759,3.31c-4.6822,0-8.4361-3.9963-8.4361-10.1318-.04-6.66,4.1173-10.5348,8.84-10.5348,2.4621,0,4.3188.8878,5.2067,2.22h.0808V59.78Zm-6.1355,17.276a5.5178,5.5178,0,0,0-.0808-1.1306,3.6889,3.6889,0,0,0-3.5918-2.9867c-2.8261,0-4.239,2.5026-4.239,5.6108,0,3.3495,1.6556,5.4486,4.1983,5.4486a3.6348,3.6348,0,0,0,3.5923-2.9461,7.9684,7.9684,0,0,0,.121-1.4126ZM176.5449,51.929H140.1377a4.6049,4.6049,0,0,0-4.5975,4.6129V93.4582a4.6048,4.6048,0,0,0,4.5975,4.6128h36.4072a4.6047,4.6047,0,0,0,4.5975-4.6128V56.5419A4.6048,4.6048,0,0,0,176.5449,51.929Zm-26.372,36.51h-6.1352V68.7007h6.1352Zm-3.1081-22.16a3.0739,3.0739,0,1,1,3.31-3.0675A3.0582,3.0582,0,0,1,147.0648,66.2787Zm25.5087,22.16h-6.135V77.5c0-2.5428-.8884-4.2783-3.1085-4.2783a3.3689,3.3689,0,0,0-3.148,2.3,4.42,4.42,0,0,0-.2023,1.5342V88.4385h-6.135V74.9972c0-2.462-.0806-4.52-.1611-6.2965h5.3276l.2829,2.7447h.1209a7.0883,7.0883,0,0,1,6.0952-3.1889c4.0364,0,7.0633,2.7047,7.0633,8.5168Z"/> </svg>
LinkedIn ist das weltweit größte berufliche soziale Netzwerk mit mehr als 500 Millionen Nutzern in über 200 Ländern und Gebieten weltweit. Um die riesige globale Nutzerbasis zu bedienen, verfügt das Unternehmen über eine umfangreiche IT-Architektur, die aus vielen Komponenten von Erst- und Drittanbietern besteht.
LinkedIn ist eine Partnerschaft mit Catchpoint eingegangen, um:
- Durchführung aktiver Beobachtungstests ihrer globalen Infrastruktur von Erst- und Drittanbietern zur Optimierung von Leistung und Verfügbarkeit.
- Überwachen Sie DNS, CDNs, PoPs und verschiedene Seiten (Profil, Feed usw.) sowohl aus interner als auch aus Kundenperspektive.
- Übermitteln Sie Echtzeit-Überwachungsdaten, um Leistungsprobleme zu erkennen, bevor die Benutzer davon betroffen sind.
- Gemeinsame Nutzung von Daten mit Drittanbietern bei der Behebung von Problemen.
- Erkennen Sie lokalisierte Leistungsprobleme in wichtigen Regionen.
Ich habe schon viele Überwachungstools verwendet, und ich muss sagen, dass Catchpoint aus der Masse heraussticht. Es gibt so viele Knotenpunkte und so viele Funktionen, und wir sind immer in der Lage, die wichtigen Daten auf die von uns gewünschte Weise zu präsentieren.
Problem
LinkedIn bedient Nutzer in allen Teilen der Welt, was eine Vielzahl von Drittanbietern erfordert, darunter drei DNS-Auflösungsdienste (Domain Name System), fünf Content Delivery Networks (CDNs) und das interne CDN. Da das Unternehmen bei der digitalen Bereitstellung so sehr auf Lösungen von Drittanbietern angewiesen ist, muss das LinkedIn Site Reliability Engineering (SRE)-Team die Leistung dieser Cloud-Lösungen genau im Auge behalten, um sicherzustellen, dass die Endbenutzer das bestmögliche digitale Erlebnis erhalten. Dies kann in bestimmten Teilen der Welt wie China, Indien, anderen Teilen Asiens und Südamerika eine besondere Herausforderung darstellen, da die lokale Infrastruktur vor Ort oft nicht in der Lage ist, das von LinkedIn geforderte Leistungsniveau zu bieten.
Die Benutzer verbringen in der Regel eine bestimmte Zeit auf einer Website. Je schneller die Website arbeitet, desto mehr Seitenaufrufe werden generiert. Das SRE-Team von LinkedIn verwaltet alle externen Dienste und optimiert jeden Schritt des Weges vom nächstgelegenen Präsenzpunkt bis zum Endnutzer mit dem Ziel, die Latenzzeiten auf ein Minimum zu reduzieren und die Verfügbarkeit zu maximieren. Zu diesem Zweck müssen sie in der Lage sein, Leistungsdaten all dieser Dienste zu generieren, um den bestmöglichen Überblick über die Endnutzererfahrung zu erhalten, und diese Daten in Echtzeit zu sammeln und zu analysieren, um sicherzustellen, dass die Nutzer zum richtigen Zeitpunkt an das richtige CDN weitergeleitet werden.
Lösung
In Anbetracht der riesigen und ausgedehnten Nutzerbasis von LinkedIn ist die globale Knoteninfrastruktur von Catchpointein entscheidender Bestandteil der Überwachungsstrategie des Unternehmens. Mit mehr als 600 globalen Überwachungsagenten bei Dutzenden von verschiedenen ISPs, darunter sowohl Backbone- als auch Last-Mile-Agenten, kann das SRE-Team von LinkedIn die Endnutzererfahrung unabhängig vom Standort der Nutzer verfolgen. Dies ist wichtig, um sicherzustellen, dass die Infrastruktur von Drittanbietern den Erwartungen entspricht.
"Ich habe schon viele Überwachungstools verwendet, und ich muss sagen, dass Catchpoint aus der Masse heraussticht", sagt Samir Jafferali, Linkedin Edge Performance SRE. "Es gibt so viele Knoten und so viele Funktionen, und wir sind immer in der Lage, die Daten, die wichtig sind, in der von uns gewünschten Form zu präsentieren. Die anderen Tools haben zwar Agenten an anderen Standorten, aber es sind nicht unbedingt die Standorte, die für uns wichtig sind."
Diese Tests werden mit dem Web Transaction Monitor von Catchpointdurchgeführt, der den HTTP-Inhalt über benutzerdefiniertes Selenium-Scripting testet und die Header für jedes einzelne Objekt auf der Seite erfasst. Die Tests sind dann an bestimmte Leistungsschwellen für alle CDNs gebunden, und die Ergebnisse werden dank des Catchpoint Test Data Webhook in Echtzeit in das interne System von LinkedIn eingespeist. Auf diese Weise kann das SRE-Team Erhöhungen der Latenz erkennen, sobald sie auftreten, und gegebenenfalls den Benutzer an ein anderes CDN weiterleiten, während der Anbieter das Problem behebt.
Auf der DNS-Seite führt LinkedIn ständige Tests mit den zwei verschiedenen DNS-Monitoren von Catchpointdurch: DNS-Erfahrungstests ermöglichen es Catchpoint , sich wie ein DNS-Resolver zu verhalten, die Latenz aus der Sicht des Endbenutzers zu messen und detaillierte Leistungsdaten zu liefern; direkte Nameserver-Tests überwachen die Nameserver selbst und liefern so Daten, die direkt mit der Verfügbarkeit des Servers und damit der Website selbst verbunden sind. Durch die Kombination dieser DNS-Tests erhält LinkedIn den vollen Umfang seiner DNS-Leistung.
Ergebnisse
Die Fähigkeit, diese Daten zeitnah zu sammeln, zu analysieren und weiterzugeben - selbst während einer Leistungskrise - ist für das Serviceangebot von LinkedIn von entscheidender Bedeutung. Mit historischen Trends, die mit benutzerdefinierten Visualisierungen verknüpft sind, kann LinkedIn die Daten auf eine beliebige Anzahl verschiedener Arten präsentieren, die ihren Bedürfnissen entsprechen und die Ursache des Problems aufdecken.
"Die anderen Tools bieten zwar historische Trends, aber die grafischen Möglichkeiten sind begrenzt", bemerkt Jafferali. "Die Fähigkeit von [Catchpoint], Kopfzeilen für jedes einzelne Objekt auf der Seite zu erfassen und dann die Kopfzeilen zu analysieren und Variationen der Kopfzeilen im Laufe der Zeit von verschiedenen AS darzustellen, ist sehr leistungsfähig."
Und mit der öffentlichen URL-Funktion von Catchpointkönnen die Daten und Diagramme schnell und einfach weitergegeben werden, während das Team mit dem Anbieter an der Lösung des Problems arbeitet. Durch die getrennte Erfassung von Daten zu Geschwindigkeit/Latenz und Verfügbarkeit kann das SRE-Team Probleme schnell und einfach isolieren, indem es seine Catchpoint-gestützte Analyse-Engine nutzt, um die Ursache von Problemen zu ermitteln und die Daten sofort an ihre Anbieter zu exportieren, damit diese das Problem beheben können.