此产品的文档集力求使用非歧视性语言。在本文档集中,非歧视性语言是指不隐含针对年龄、残障、性别、种族身份、族群身份、性取向、社会经济地位和交叉性的歧视的语言。由于产品软件的用户界面中使用的硬编码语言、基于 RFP 文档使用的语言或引用的第三方产品使用的语言,文档中可能无法确保完全使用非歧视性语言。 深入了解思科如何使用包容性语言。
思科采用人工翻译与机器翻译相结合的方式将此文档翻译成不同语言,希望全球的用户都能通过各自的语言得到支持性的内容。 请注意:即使是最好的机器翻译,其准确度也不及专业翻译人员的水平。 Cisco Systems, Inc. 对于翻译的准确性不承担任何责任,并建议您总是参考英文原始文档(已提供链接)。
本文档介绍如何备份(快照)身份验证、授权和记帐(AAA)实例的分步过程。
必须每个站点和一个站点一次执行此操作,以最大程度地减少对用户流量的影响。
此过程适用于使用NEWTON版本的OpenStack环境,其中弹性服务控制器(ESC)不管理Cisco Prime Access Registrar(CPAR),并且CPAR直接安装在OpenStack上部署的虚拟机(VM)上。
Ultra-M是预打包和验证的虚拟化移动数据包核心解决方案,旨在简化虚拟网络功能(VNF)的部署。OpenStack是Ultra-M的虚拟化基础设施管理器(VIM),由以下节点类型组成:
此图中描述了Ultra-M的高级体系结构和涉及的组件:
注意:为了定义本文档中的步骤,我们考虑了Ultra M 5.1.x版本。
通常,当CPAR进程关闭时,KPI降级是预期的,就像您关闭应用程序时一样,发送直径对等体关闭陷阱最多需要5分钟。此时,路由到CPAR的所有请求都将失败。在此时间后,链路被确定为关闭,并且Diameter路由代理(DRA)停止向此节点路由流量。
此外,对于AAA中关闭的所有现有会话,如果存在连接/分离过程,该过程将失败,因为托管安全即服务(HSS)回复用户已在关闭的AAA上注册,并且该过程将无法成功完成。
预计在活动完成10小时后,STR的成功率将低于90%。此后,必须达到90%的正常值。
每当CPAR服务停止和启动时,都会生成简单网络管理协议(SNMP)警报,因此SNMP陷阱预期在整个过程中都会生成。预期陷阱包括:
注意:确保您对已部署站点的HORIZON有Web访问权限,并能访问OSPD。
步骤1.打开连接到Transformation Management Office(TMO)Production网络的所有Secure Shell(SSH)客户端,并连接到CPAR实例。
注意:切勿同时关闭一个站点内的所有4个AAA实例,一次关闭一个实例。
步骤2.要关闭CPAR应用,请运行以下命令:
/opt/CSCOar/bin/arserver stop
必须显示消息“Cisco Prime Access Registrar Server Agent Shutdown complete”。
注意:如果CLI会话保持打开状态,则arserver stop命令将无法工作,并且显示此错误消息。
ERROR: You can not shut down Cisco Prime Access Registrar while the CLI is being used. Current list of running CLI with process id is: 2903 /opt/CSCOar/bin/aregcmd –s
在本例中,需要终止突出显示的进程ID 2903,然后才能停止CPAR。如果出现这种情况,请运行命令并终止此过程:
kill -9 *process_id*
然后,重复步骤1。
步骤3.要验证CPAR应用确实已关闭,请运行以下命令:
/opt/CSCOar/bin/arstatus
必须显示以下消息:
Cisco Prime Access Registrar Server Agent not running Cisco Prime Access Registrar GUI not running
步骤1.输入与当前处理的站点(城市)对应的Horizon GUI网站。
访问Horizon时,观察到的屏幕如图所示。
步骤2.导航至“项目”>“实例”,如图所示。
如果使用的用户是CPAR,则此菜单中仅显示4个AAA实例。
步骤3.一次只关闭一个实例,重复本文档中的整个过程。要关闭VM,请导航至操作>关闭实例(如图所示)并确认选择。
步骤4.要验证实例确实已关闭,请选中Status = Shutoff和Power State = Shut Down,如图所示。
此步骤将结束CPAR关闭过程。
一旦CPAR VM关闭,快照可以并行拍摄,因为它们属于独立计算机。
四个QCOW2文件并行创建。
步骤1.拍摄每个AAA实例的快照。
注意:使用QCOW映像作为源的实例为25分钟,使用原始映像作为源的实例为1小时。
步骤2.登录POD的Openstack的Horizon GUI。
步骤3.登录后,导航到顶部菜单上的Project > Compute > Instances,并查找AAA实例,如图所示。
步骤3.单击创建快照以继续创建快照,如图所示。这需要在相应的AAA实例上执行。
步骤4.执行快照后,导航至“图像”菜单,并验证所有操作是否完成并报告没有问题,如图所示。
步骤5.下一步是下载QCOW2格式的快照并将其传输到远程实体,以防OSPD在此过程中丢失。为此,请在OSPD级别运行命令glance image-list来识别快照,如图所示。
步骤6.一旦确定要下载的快照(在本例中,该快照标有绿色),您就可以使用命令glance image-download将其下载到QCOW2格式下载:
[root@elospd01 stack]# glance image-download 92dfe18c-df35-4aa9-8c52-9c663d3f839b --file /tmp/AAA-CPAR-LGNoct192017.qcow2 &
将进程发送到后台(&S)。完成操作需要一些时间。完成后,映像可位于/tmp目录下来。
步骤7.下载过程完成后,需要执行压缩过程,因为由于操作系统(OS)处理的进程、任务和临时文件,快照可以用ZEROES填充。 为文件压缩运行的命令为virt-sparsify。
[root@elospd01 stack]# virt-sparsify AAA-CPAR-LGNoct192017.qcow2 AAA-CPAR-LGNoct192017_compressed.qcow2
此过程可能需要一些时间(大约10-15分钟)。 完成后,结果文件是需要按照下一步中指定的方式传输到外部实体的文件。
需要验证文件完整性,为此,请运行下一个命令并在其输出末尾查找“损坏”属性。
[root@wsospd01 tmp]# qemu-img info AAA-CPAR-LGNoct192017_compressed.qcow2 image: AAA-CPAR-LGNoct192017_compressed.qcow2 file format: qcow2 virtual size: 150G (161061273600 bytes) disk size: 18G cluster_size: 65536 Format specific information: compat: 1.1 lazy refcounts: false refcount bits: 16 corrupt: false
步骤8.为避免OSPD丢失的问题,需要将最近创建的QCOW2格式快照传输到外部实体。在开始文件传输之前,必须检查目标是否有足够的可用磁盘空间,运行命令df -kh以验证内存空间。
建议使用SFTP sftp root@x.x.x.xwhere x.x.x.x是远程OSPD的IP,将其临时传输到另一站点的OSPD。
步骤9.为了加快传输速度,目的地可以发送到多个OSPD。同样,您也可以运行命令scp *name_of_the_file*.qcow2 root@ x.x.x.x:/tmp(其中x.x.x.x.x是远程OSPD的IP),以将文件传输到另一个OSPD。
可以重新部署上一个实例,并在前面的步骤中拍摄快照。
步骤1. [可选]如果以前没有可用的VM快照,则连接到发送备份的OSPD节点,并将备份发送回其原始OSPD节点。使用sftp root@x.x.x.x,其中x.x.x.x是原始OSPD的IP。将快照文件保存在/tmp目录中。
步骤2.连接到实例重新部署的OSPD节点,如图所示。
步骤3.要将快照用作映像,必须将其上传到水平。使用下一个命令执行此操作。
#glance image-create -- AAA-CPAR-Date-snapshot.qcow2 --container-format bare --disk-format qcow2 --name AAA-CPAR-Date-snapshot
该过程可在水平线中看到,如图所示。
步骤4.在Horizon中,导航至Project > Instances,然后单击Launch Instance,如图所示。
步骤5.输入实例名称并选择可用区,如图所示。
步骤6.在“源”选项卡中,选择映像以创建实例。在“选择启动源”菜单中,选择映像,并在此显示映像列表。选择之前通过单击其+号上传的,如图所示。
步骤7.在Flavor(风味)选项卡中,单击+号选择AAA风味,如图所示。
步骤8.最后,导航至“网络”选项卡,并单击+号选择实例需要的网络。对于此情况,请选择diameter-soutable1、radius-routable1和tb1-mgmt,如图所示。
步骤9.单击“启动实例”以创建实例。进度可在Horizon中监控,如图所示。
步骤10.几分钟后,该实例完全部署,并准备就绪,如图所示。
浮动IP地址是可路由的地址,这意味着它可以从Ultra M/Openstack体系结构外部访问,并且能够从网络与其他节点通信。
步骤1.在“水平线顶部”菜单中,导航至“管理”>“浮动IP”。
步骤2.单击“将IP分配到项目”。
步骤3.在分配浮动IP窗口中,选择新浮动IP所属的池、要分配该浮动IP的项目,以及新的浮动IP地址本身,如图所示。
步骤4.单击Allocate Floating IP。
步骤5.在“展望期顶部”菜单中,导航至“项目”>“实例”。
步骤6.在“操作”列中,单击指向“创建快照”按钮下方的箭头,即会显示菜单。单击关联浮动IP选项。
步骤7.在IP地址字段中选择要使用的相应浮动IP地址。
步骤8.单击“关联”。
步骤1.在“展望期顶部”菜单中,导航至“项目”>“实例”。
步骤2.单击“启动新实例”一节中创建的实例/VM的名称。
步骤3.单击“控制台”。这显示VM的CLI。
步骤4.显示CLI后,输入正确的登录凭据,如图所示:
username:根
密码:<cisco123>
步骤5.在CLI中,运行命令vi /etc/ssh/sshd_config以编辑SSH配置。
步骤6.打开SSH配置文件后,按I以编辑文件。然后,将第一行从PasswordAuthentication no更改为PasswordAuthentication yes,如图所示。
步骤7.按ESC键并输入:wq!以保存sshd_config文件更改。
步骤8.运行命令service sshd restart,如图所示。
步骤9.要测试SSH配置更改是否已正确应用,请打开任何SSH客户端,并尝试与分配给实例(即10.145.0.249)和用户根建立远程安全连接。
步骤1.使用安装应用的相应VM/服务器的IP地址打开SSH会话,如图所示。
完成活动并在关闭的站点中重新建立CPAR服务后,请执行以下步骤。
步骤1.重新登录Horizon,导航至“项目”>“实例”>“开始实例”。
步骤2.验证实例的状态为“活动”,并且电源状态为“运行”,如图所示。
步骤1.在操作系统级别运行命令/opt/CSCOar/bin/arstatus:
[root@wscaaa04 ~]# /opt/CSCOar/bin/arstatus Cisco Prime AR RADIUS server running (pid: 24834) Cisco Prime AR Server Agent running (pid: 24821) Cisco Prime AR MCD lock manager running (pid: 24824) Cisco Prime AR MCD server running (pid: 24833) Cisco Prime AR GUI running (pid: 24836) SNMP Master Agent running (pid: 24835) [root@wscaaa04 ~]#
步骤2.在操作系统级别运行命令/opt/CSCOar/bin/aregcmd并输入管理员凭证。验证CPAR运行状况是10/10,并退出CPAR CLI。
[root@aaa02 logs]# /opt/CSCOar/bin/aregcmd Cisco Prime Access Registrar 7.3.0.1 Configuration Utility Copyright (C) 1995-2017 by Cisco Systems, Inc. All rights reserved. Cluster: User: admin Passphrase: Logging in to localhost [ //localhost ] LicenseInfo = PAR-NG-TPS 7.3(100TPS:) PAR-ADD-TPS 7.3(2000TPS:) PAR-RDDR-TRX 7.3() PAR-HSS 7.3() Radius/ Administrators/ Server 'Radius' is Running, its health is 10 out of 10 --> exit
步骤3.运行命令netstat | grep diameter,并验证所有DRA连接都已建立。
此处提到的输出适用于需要Diameter链路的环境。如果显示的链路较少,则表示与需要分析的DRA断开。
[root@aa02 logs]# netstat | grep diameter tcp 0 0 aaa02.aaa.epc.:77 mp1.dra01.d:diameter ESTABLISHED tcp 0 0 aaa02.aaa.epc.:36 tsa6.dra01:diameter ESTABLISHED tcp 0 0 aaa02.aaa.epc.:47 mp2.dra01.d:diameter ESTABLISHED tcp 0 0 aaa02.aaa.epc.:07 tsa5.dra01:diameter ESTABLISHED tcp 0 0 aaa02.aaa.epc.:08 np2.dra01.d:diameter ESTABLISHED
步骤4.检查网真服务器(TPS)日志是否显示CPAR处理的请求。突出显示的值代表TPS,这些值是您需要注意的值。
TPS的值不得超过1500。
[root@wscaaa04 ~]# tail -f /opt/CSCOar/logs/tps-11-21-2017.csv 11-21-2017,23:57:35,263,0 11-21-2017,23:57:50,237,0 11-21-2017,23:58:05,237,0 11-21-2017,23:58:20,257,0 11-21-2017,23:58:35,254,0 11-21-2017,23:58:50,248,0 11-21-2017,23:59:05,272,0 11-21-2017,23:59:20,243,0 11-21-2017,23:59:35,244,0 11-21-2017,23:59:50,233,0
步骤5.在name_radius_1_log中查找任何“error”或“alarm”消息:
[root@aaa02 logs]# grep -E "error|alarm" name_radius_1_log
步骤6.要验证CPAR进程使用的内存量,请运行以下命令:
top | grep radius
[root@sfraaa02 ~]# top | grep radius 27008 root 20 0 20.228g 2.413g 11408 S 128.3 7.7 1165:41 radius
此突出显示值必须低于7Gb,这是应用级别允许的最大值。