Accueil Forums Infrastructures RTA – Réseau Télécommunication Amateur [Déploiement] Preissac – Secteur Rapides Reply To: [Déploiement] Preissac – Secteur Rapides

#580
VA2XJM
Keymaster

Les informations suivantes sont inscrites afin de fournir des pistes de solutions et de documenté notre parcours.

La semaine dernière, nos équipements dans la tour du site sont tombé en panne. Je n’ai pas été en mesure de me rendre sur place encore, mais voici les détails actuels.

Chronologie:
2020-01-09 14:39 -> VE2ATU-FN08TJ-PTP184 ne répond plus.
2020-01-09 14:39 -> VE2ATU-FN08TJ-Switch02 ne répond plus.
2020-01-10 12:48 -> VE2ATU-FN08TJ-NSM176 ne répond plus.
2020-01-10 12:50 -> VE2ATU-FN08TJ-NSM180 ne répond plus.

Configuration des équipements:
– VE2ATU-FN08TJ-Switch02 alimente les 3 nodes présent dans la tour sur ce site, vu l’impossibilité de passé plusieurs câbles. Elle surveille aussi l’état des équipements et fait un «power flash» si un équipement ne répond plus afin de le redémarrer. Elle gère aussi les priorité d’alimentation et coupe l’alimentation des nodes dans l’ordre défini selon les priorités. En cas de panique, la switch coupe du port #5 vers le port #1.
– VE2ATU-FN08TJ-PTP184 (port #5) est le node primaire du site. La switch s’identifie au réseau via ce node car il sera le point-a-point vers notre tour.
– VE2ATU-FN08TJ-NSM176 (port #4) et VE2ATU-FN08TJ-NSM180 (port #3) sont 2 sectoriels permettant aux radioamateurs de se brancher au réseau.

Description des évènements

2020-01-09 14:39 : VE2ATU-FN08TJ-PTP184 ne répond plus au monitorage. Normalement la switch essais de redémarrer l’équipement.

2020-01-09 14:39 : VE2ATU-FN08TJ-Switch02 ne répond plus au monitorage. Comme PTP184 est le node primaire, si ce dernier ne répond pas, la switch ne peux répondre. Dans la situation c’est «normale». Par contre les nodes NSM sont toujours en-ligne, ce qui indique sur le moment que la switch est toujours active.

A ce moment la situation n’est pas urgente puisque le node PTP184 n’a pas encore d’homologue. La switch ne semble pas être en mesure de redémarrer le node, je suspect donc un bris du node.

2020-01-10 12:48 : VE2ATU-FN08TJ-NSM176 ne répond plus. Le retour du node devrait se faire dans les 2 prochaines minutes.

2020-01-10 12:50 : VE2ATU-FN08TJ-NSM180 ne répond plus. Le retour du node devrait se faire dans les 2minutes, mais ne se fait pas.

La configuration de la switch est faite de façons à ce que les modules NSM soient les premiers à être désactivé si un problème d’alimentation électrique survient afin de gardé le lien vers le RTA actif. En cas de «panic» du coté de la switch, cette configuration peux être ignoré et la switch désactive donc les ports en débutant par le #5 vers le #1 selon la capacité disponible.

Le fait que les modules ont été désactivé dans l’ordre #5 vers #1 et des espacements dans le temps, il me semble qu’un problème au niveau de l’alimentation électrique ai forcé la switch à couper l’alimentation sans tenir compte de nos priorité. Possiblement que le PSU de l’injecteur qui envoie l’alimentation dans le câble de donnée vers la tour est défectueux. J’ai déjà en main un PSU de remplacement.

Prochainement je ferai une visite afin de validé le problème et remplacé le PSU au besoin. Je regarde aussi pour faire l’ajout d’une redondance de l’alimentation OU d’alimenter la tour d’une autre façon. Le défi ici est de devoir alimenté plusieurs nodes via un seul câble vu l’espace disponible dans les conduits de service très réduite. Dans une installation idéale, chaque node aurait sont câble afin de répartir la charge sur plusieurs ports de la switch et de pouvoir contrôlé l’alimentation de chacun des nodes.

Lors de la remise en fonction des nodes, les switches du site seront reconfigurer en mode «bridge» afin de permettre à la switch de la tour de s’identifier au réseau via le module «gateway» et ainsi être rejointe même si les 3 modules dans la tour sont hors-ligne. Les nodes seront rebrancher en suivant la priorité de désactivation du mode «panic» et la configuration des priorités sera enlevé. Ces changements seront maintenant l’installation par défaut des prochains sites.

Il est aussi possible qu’un bris d’équipement dans la tour ai été causé par une chute de glace, mais cela est peu probable. Si c’est le cas, une intervention sera planifié selon la météo.