您的位置:首页 > 运维架构

OpenStack虚拟机迁移的排错经历

2016-11-29 10:58 495 查看
一、热迁移的排错经历
先来看下cpu型号,从/proc/cpuinfo中可以看出所有cpu型号版本是一样的





通过nova live-migration --debug <instance-xxx> <node-xxxx>命令行迁移,可以看到报错信息




通过nova-compute log错误信息定位代码




再下面就到libvirt.py了



通过这个api,看不出具体错误信息,可能是跟flags是0有关系。

通过debug代码,保存cpu xml信息到某个文件




通过virsh接口可以看到错误, 舒了一口气!




一样的cpu不一样的cpu features,亮瞎我了!

对比宿主机的cpu flags,真的差了一个monitor特性,后面查到是曙光服务器的bios版本不一致,涨姿势了!




kvm是支持实例以指定的cpu启动,通过在/etc/nova/nova.conf中配置cpu_mode和cpu_model

[libvirt]
cpu_mode=custom
cpu_model=kvm64

重启openstack-nova-compute服务生效,如果要对已存在的实例生效,需对其硬重启。 在cpu配置为kvm64下 window 2012R2 vm启动会有问题,症状跟在这里描述的一样:https://bugzilla.redhat.com/show_bug.cgi?id=1086319

对应的qemu、libvirt版本:

qemu: 1.5.3
libvirt: 1.2.17

二、冷迁移的排错经历
如果nova-scheduler节点nova.conf中的scheduler_default_filters配置项有AvailabilityZoneFilter这个配置,然后改了availability-zone(默认为nova),改为其它名字。 冷迁移的时候走调度,结果AvailabilityZoneFilter过滤后没有匹配的主机了。
class AvailabilityZoneFilter(filters.BaseHostFilter):
"""Filters Hosts by availability zone.
Works with aggregate metadata availability zones, using the key
'availability_zone'
Note: in theory a compute node can be part of multiple availability_zones
"""
# Availability zones do not change within a request
run_filter_once_per_request = True

def host_passes(self, host_state, filter_properties):
spec = filter_properties.get('request_spec', {})
props = spec.get('instance_properties', {})
availability_zone = props.get('availability_zone')

if not availability_zone:                                            #第一次创建虚拟机的时候,还有availability_zone,返回是true
return True
metadata = utils.aggregate_metadata_get_by_host(                     #对已创建好的虚拟机;有两种判断
host_state, key='availability_zone')
if 'availability_zone' in metadata:                                    #1、给主机聚合设置元数据
hosts_passes = availability_zone in metadata['availability_zone']
host_az = metadata['availability_zone']
else:
hosts_passes = availability_zone == CONF.default_availability_zone    #2、跟default_availability_zone(默认也为nova)配置项比较
host_az = CONF.default_availability_zone

if not hosts_passes:
LOG.debug("Availability Zone '%(az)s' requested. "
"%(host_state)s has AZs: %(host_az)s",
{'host_state': host_state,
'az': availability_zone,
'host_az': host_az})
return hosts_passes
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  openstack