当前位置:网站首页>Automatisation et livraison dans le cadre de tdsql Multi - Clusters

Automatisation et livraison dans le cadre de tdsql Multi - Clusters

2021-09-15 08:29:52 Tencent Cloud Database

“Trois centres à deux endroits” Système de déploiement

file

“Trois centres à deux endroits” Architecture comme son nom l'indique : Dans une ville A、B Deux salles d'ordinateurs , Une autre ville a CSalle informatique, Dans la première ville TDSQL Les instances de la base de données sont les mêmes que IDCAsynchrone、CrossIDC Forte synchronisation , Nous devons déployer quatre noeuds de données dans deux salles d'ordinateurs dans la première ville , Où le noeud principal et un noeud de secours sont dans une salle des machines , Deux autres noeuds de secours dans l'autre salle des machines . Et entre les instances de base de données de la première et de la deuxième ville , La réplication asynchrone est utilisée , Assurer une disponibilité élevée et une reprise après sinistre au niveau des villes financières .

“Quatre centres à deux endroits” Système de déploiement

file

“Quatre centres à deux endroits”Architecture de, Est une architecture de synchronisation forte pour la commutation automatique , Pour tout centre de données et toute défaillance 30Basculer en quelques secondes, Et aucune perte de données , Les performances sont stables et fiables , Disponibilité accrue et réduction des coûts pour les entreprises et les utilisateurs .

TDSQL Services d'assurance de la qualité :

Inspection automatique de l'ensemble du processus de production

Enfin, Le plus important est de savoir comment nous pouvons garantir TDSQL Qualité de la prestation des services .

TDSQL La qualité de la livraison est garantie par un système d'inspection automatique des patrouilles .TDSQL Le système d'inspection automatique des patrouilles assure la qualité de la livraison par trois dimensions :

file

Analyse des indicateurs de suivi

La première dimension est basée sur TDSQL Le Centre de surveillance existant effectue une analyse des indicateurs pertinents. , Y compris l'analyse des indicateurs de l'heure actuelle et de l'heure historique . Quand nous voulons vérifier si un Cluster a un problème , En plus d'analyser les anomalies et les alarmes dans le cluster en ce moment 、 S'il y a une surcharge de ressources, etc. , Il faut également analyser les questions historiques , Par exemple, quelle est la courbe de chaque indicateur au cours des sept derniers jours de l'histoire? . Pourquoi analyser les courbes des indicateurs des sept derniers jours de l'histoire ? Un exemple de scénario simple , Par exemple, un scénario où les heures de pointe sont de 15 h à 17 h tous les jours , Il peut y avoir beaucoup de requêtes lentes pendant les heures de pointe , Il y a même des problèmes de performance avec les requêtes lentes . Comment le système surveille - t - il les problèmes à un moment donné de l'histoire? ? Alors, quand nous avons lancé le Programme d'inspection automatique, , Comme le matin. 8A l'heure, En période de pointe , Il n'y a pas de problème. , Nous devons donc analyser les indicateurs historiques .

Les indicateurs spécifiques analysés dans le schéma comprennent la détection de la connectivité de premier plan. 、 Comment copier une instance 、 Mode de commutation principal / de secours, etc. . La surveillance est divisée en deux aspects principaux: : Premièrement, la collecte des indicateurs de surveillance 、Escalade、Collection, C'est le Centre de surveillance. . Deuxièmement, analyser les données de surveillance , Et l'analyse des anomalies considérées comme des alarmes . Certaines stratégies seront suivies lors de l'analyse et de l'alarme. —— Quelles données de surveillance sont anormales 、 C'est nécessaire. ?En coursTDSQL Un ensemble de modèles d'alarme est maintenu , Fournit également au client 、 Options personnalisées , Le client peut modifier la politique d'alarme en fonction de sa situation réelle ; Entre - temps, il fournit une comparaison des stratégies d'alarme basées sur l'expérience pratique accumulée. , Au cas où l'utilisateur ferait des modifications déraisonnables , Exposition aux risques potentiels des stratégies d'alerte .

Dans cette dimension ,TDSQL La synchronisation multi - sources et d'autres modules peuvent surveiller la synchronisation des données , La stabilité de leur synchronisation actuelle 、 Comment fonctionne la synchronisation , D'autres sont les indicateurs de surveillance des alarmes de chaque module. .

Analyse de l'environnement du cluster

La deuxième dimension complète la première . L'analyse de la deuxième dimension est au niveau de la machine , Données de surveillance non collectées , Est un accès direct à l'arrière - plan du serveur , Au niveau de la machine IO、CPU、Mémoire、Disque、 Essai de stabilité, etc. .

Sauf au niveau de la machine et du processus , Nous effectuons également un balayage personnalisé au niveau de l'Instance , Cela se reflète dans le module d'examen physique de l'exemple —— Par exemple, un examen physique TDSQL Plate - forme intelligente de diagnostic et d'analyse “Pies Plates”Interface pour, Peut fournir des exemples d'opérations à partir de 、Développement、 Analyse systématique du rendement et d'autres indicateurs .

Niveau des grappes , Nous nous concentrerons sur la synchronisation entre les machines de ce Cluster 、 Si le cluster de métadonnées dans l'Instance a une sauvegarde 、 Si la sauvegarde est normale, etc. .

Exercices automatisés

Il n'y a aucun problème à scanner le cluster actuel dans toutes les dimensions ,TDSQL Et à partir des résultats , Une fois pour toute la grappe P0 Niveau de forage automatisé , Le scénario de l'exercice est celui où nous opérons et gérons normalement. , Inclure des exemples d'achat 、Créer un utilisateur、Autorisation de l'utilisateur、Créer une table de bibliothèque, Apporter des modifications à la structure de la table de la bibliothèque 、Expansion horizontale、 Expansion verticale 、 Machine de secours multiple 、 Réception lente des requêtes 、 Sauvegarde et retour de fichiers, etc. . Enfin, le système supprimera les instances achetées ,Paire de mise en œuvreP0 Forage automatique en boucle fermée pour les scènes de niveau .

En résumé,TDSQL Système d'inspection automatique des patrouilles au niveau de l'indicateur , Numériser l'ensemble de l'environnement du cluster , Et assurer la sécurité de l'ensemble de la prestation des grappes grâce à des exercices automatisés 、Stable、Fiable、Haute disponibilité.

En plus des garanties techniques ,TDSQL Pendant ce temps, une grande quantité de travail de production a été précipitée. , Aide l'utilisateur rapidement 、 Accès facile aux bases de données distribuées .

file

Nous tenons également à jour régulièrement les informations des clients , Tout d'abord, lancez régulièrement une patrouille de Clusters pour les clients , Grâce à cette inspection, vous pouvez vous assurer que l'environnement actuel et historique du client est correct. . L'inspection des patrouilles consiste principalement à effectuer des exercices fonctionnels et de reprise après sinistre. , Passer l'inspection périodique automatique , Si le système de gestion scanne une version à mettre à jour recommandée par le client , Sera automatiquement poussé au représentant du client , Mise à niveau du client par le représentant du client .

file

Enfin, Opérations quotidiennes du client 、 Changement quotidien , La plupart des problèmes auxquels les opérations sont confrontées sont liés à l'expansion de la capacité. 、Mise à jour、 Traitement des alarmes ?TDSQL Fournir un plan d'expansion automatique pour chaque noeud , Peut être agrandi en un seul clic . De même, la mise à niveau fournit une fonctionnalité de fonctionnement en un seul clic , Mise à jour point point point point point point point point point point , La mise à niveau par lots de l'ensemble du cluster peut également être effectuée .TDSQL D'une part, la grande disponibilité de l'architecture flexible et de la capacité de reprise après sinistre , Et une forte cohérence des données .

file

Disponibilité TDSQL Un système automatique de traitement des alarmes est fourni. , Analyse automatique des alarmes , Traitement automatique de certaines alarmes , Réduire la charge de travail de l'exploitation actuelle du réseau .

Ce que nous avons décrit ci - dessus est axé sur la prestation TDSQL Plusieurs défis liés à la prestation rencontrés au cours de l'histoire , Et relever ces défis , Notre offre de livraison automatisée , Et enfin à l'ensemble TDSQL La qualité de la prestation normalisée et du service à la clientèle offre une gamme de mécanismes et de capacités améliorés .

C'est le partage d'aujourd'hui. ,Merci à tous.!

PartⅣ Q&A

Q:TDSQL Prise en charge de la sauvegarde hors ligne de la base de données ?

A:TDSQL Prise en charge de plusieurs méthodes de sauvegarde , Peut être basé sur des sauvegardes physiques , Peut également être basé sur une sauvegarde logique . L'ensemble du processus de sauvegarde est effectué sur la machine de secours , N'affecte pas l'accès normal aux entreprises , N'aura pas non plus d'incidence sur le rendement de l'accès aux entreprises .

Q:TDSQL Comment accéder aux messages texte 、Voix、 Plate - forme d'alarme du courrier ?

A:TDSQL L'accès à l'alarme est flexible ,Tout d'abord,TDSQL Le message d'alarme est sous forme de texte , Peut être envoyé à n'importe quelle plateforme , Il existe de nombreux modes d'accès aux alarmes adaptés aux clients actuels. , Par exemple, le client a HTTP Plate - forme d'alarme de l'interface , Il y a aussi d'autres interfaces . Selon l'interface souhaitée par le client ,TDSQL Vous pouvez envoyer un paquet correspondant , Contient des informations d'alarme , Envoyez - le à votre plate - forme de réception d'alarme. .

版权声明
本文为[Tencent Cloud Database]所创,转载请带上原文链接,感谢
https://chowdera.com/2021/09/20210914161914159O.html

随机推荐