目标

对比一下docker overlay、calico和host网络的带宽，延迟。

测试环境硬件

千兆网卡 BCM5719
CPU E5-2630 0 @ 2.30GHz

测试环境软件

kernel 3.10.0-327
docker 1.12.3
calico 0.23.0

测试的compose

1. calico compose


netperf1:

  image: netperf:1.0

  net: vnet

  restart: always

  mem_limit: 20480M

  labels:

    - "com.alipay.proj=netperf"

  environment:

    - "affinity:container!=*netperf*"

    - "constraint:node==*test1*"

  command: /sbin/init

netperf2:

  image: netperf:1.0

  net: vnet

  restart: always

  mem_limit: 20480M

  labels:

    - "com.alipay.proj=netperf"

  environment:

    - "affinity:container!=*netperf*"

    - "constraint:node==*test2*"

  command: /sbin/init

2. overlay compose


netperf1:

  image: netperf:1.0

  net: vxlan

  restart: always

  mem_limit: 20480M

  labels:

    - "com.alipay.proj=netperf"

  environment:

    - "affinity:container!=*netperf*"

    - "constraint:node==*test1*"

  command: /sbin/init

netperf2:

  image: netperf:1.0

  net: vxlan

  restart: always

  mem_limit: 20480M

  labels:

    - "com.alipay.proj=netperf"

  environment:

    - "affinity:container!=*netperf*"

    - "constraint:node==*test2*"

  command: /sbin/init

3. host compose


netperf1:

  image: netperf:1.0

  net: host

  restart: always

  mem_limit: 20480M

  labels:

    - "com.alipay.proj=netperf"

  environment:

    - "affinity:container!=*netperf*"

    - "constraint:node==*test1*"

  command: /sbin/init

netperf2:

  image: netperf:1.0

  net: host

  restart: always

  mem_limit: 20480M

  labels:

    - "com.alipay.proj=netperf"

  environment:

    - "affinity:container!=*netperf*"

    - "constraint:node==*test2*"

  command: /sbin/init

测试结果

1. host


[root@satest1 /]# time qperf netperf_netperf2_1 --time 20  tcp_bw tcp_lat  udp_lat

tcp_bw:

    bw  =  118 MB/sec

tcp_lat:

    latency  =  48.2 us

udp_lat:

    latency  =  46.1 us

2. calico


[root@55fd7810562d /]# time qperf netperf_netperf2_1 --time 20  tcp_bw tcp_lat  udp_lat

tcp_bw:

    bw  =  118 MB/sec

tcp_lat:

    latency  =  54.1 us

udp_lat:

    latency  =  50.3 us

3. vxlan


[root@1472d4ce9a24 /]# time qperf netperf_netperf2_1 --time 20  tcp_bw tcp_lat  udp_lat

tcp_bw:

    bw  =  114 MB/sec

tcp_lat:

    latency  =  63.5 us

udp_lat:

    latency  =  58.5 us

发表在 System | 留下评论

calico profile 测试

发表于2016/12/06由pm

使用calico的ipam dirver创建网络

如果使用docker默认的ipam创建calico网络，则不支持访问策略控制。
1. 创建pool

calicoctl pool add 100.100.1.0/24 --nat-outgoing
calicoctl pool add 100.100.2.0/24 --nat-outgoing

2. 创建network

docker network create --driver calico --ipam-driver calico --subnet=100.100.1.0/24 vnet1
docker network create --driver calico --ipam-driver calico --subnet=100.100.2.0/24 vnet2

3. 更新profile增加2个互相访问

calicoctl profile vnet1 rule add inbound allow from tag vnet2
calicoctl profile vnet2 rule add inbound allow from tag vnet1

创建容器测试

使用vnet1/vnet2分别创建2个容器
docker run --name vnet1 -d --net vnet1 acs-reg.sqa.alipay.net/min.peng/minios /sbin/init
docker run --name vnet2 -d --net vnet2 acs-reg.sqa.alipay.net/min.peng/minios /sbin/init

说明

可以直接使用默认的docker的ipam-driver 创建网段，但是那样就没法做策略了,且nat-outgoing和ipip的选项实际是全开的。
比如

docker network create --driver calico --opt nat-outgoing=true --opt ipip=false --subnet=10.20.0.0/22 vnet1
docker network create --driver calico --opt nat-outgoing=true --opt ipip=false --subnet=10.30.0.0/22 vnet2
使用了ipam-driver calico的话，内部的服务没法对外暴露端口。。但是nat-outgoing和ipip的配置是生效，
参考文档
- http://docs.projectcalico.org/v1.5/getting-started/docker/tutorials/basic

发表在 net | 留下评论

1. docker网络现状

当前虽然docker网络的解决方案很多，但是docker官方的方案都不是太成熟，原因有以下几点：
1. host/bridge这种模式只适合自己在virtualbox上玩玩,bridge模式NAT依赖contrack表在session多的时候会让你机器都登陆不上（不要YY把nf_conntrack_max配置的大点能高枕无忧）。
2. 剩下的macvlan/ipvlan其实是更适合中大型企业现有VLAN模型的方案，无耐对内核的要求太高，基本就是没法用。没人会因为尝试docker把生产OS切到4.X的版本。
3. 在最新版本的docker中，已经可以创建overlay的网络类型了。但是稳定性还有待考验。

在我看来，一个成熟的虚拟化网络整体方案，需要满足2个场景：
1. 支持传统的基本VLAN模式，这是能在企业内快速实施的基础条件。因此现在大家的企业对docker的扩展都是在用ovs之类的支持vlan。
2. 支持overlay，但是这个overlay不是纯孤立的一个网络。需要能做到跨network的联通，也要能做到与真实网络的打通。

2. 尝试过的docker网络方案

目前尝试过calico和官方的overlay方案。

2.1 calico方案

calico本质上是自己在一组机器上创建一个BGP网络，自己控制一个虚拟网络中下一跳得路由，三层能通的机器都部署calico。如果是在共有云的机器上，因为大家都会在宿主机器上做arp绑定等控制，只需要加一下IPIP让豹纹发出之前做一次ipip封装即可。对calico的测试用得比较多，一个主管的判断就是：能用，不够可靠。所谓的不够可靠主要体现在几方面：
1. 有时扩容一个节点，calico-node容器死活起不来，无奈的时候只能把KVstore整个目录干掉，相当于整个集群铲了重建。
2. 一个机器重启，发现起不来了。。然后整个集群重建。

2.2 官方overlay的方案

官方overlay的方案相对来说会更可靠，因为它会随着docker每个release的版本不断成熟。相关的例子可以参考nginx商业化后的行为，天然会排斥一些和自己有竞争关系的公司的方案。官方的overlay本质上是走vxlan，性能上可能会calico稍微差一些。

3. 部署案例

3.1 swarm部署

3.1.1 etcd部署
每个方案的实施都是需要先部署一个swarm集群。swarm部署的基础关键在准备好一套KV的方案。因此是简单的测试，所有我做的比较简单

$export HostIP=

hostname -i

$PROJ="etcd-calico"
$IMG="xxxxx/etcd:latest"
$sudo docker rm -f etcd
$sudo docker run --restart=always -d -v /usr/share/ca-certificates/:/etc/ssl/certs -p 4001:4001 -p 2380:2380 -p 2379:2379 \
--name etcd $IMG \
etcd -name $PROJ \
-advertise-client-urls http://${HostIP}:2379,http://${HostIP}:4001 \
-listen-client-urls http://0.0.0.0:2379,http://0.0.0.0:4001 \
-initial-advertise-peer-urls http://${HostIP}:2380 \
-listen-peer-urls http://0.0.0.0:2380 \
-initial-cluster-token etcd-cluster-1 \
-initial-cluster $PROJ=http://${HostIP}:2380 \
-initial-cluster-state new

3.1. 2 swarm部署
挑选3个机器部署swarm的管理节点

$docker run --restart=always --name swarm-mng -d -p 8888:2375 swarm manage etcd://XXXXX:2379/swarm"

然后所有的节点起agent join上去

$docker run --restart=always --name swarm-agent -d swarm join --addr=$(hostname -i):2375 etcd://xxxx:2379/swarm

3.2 官方overlay部署

管方的overlay配置比较简单

$docker network create --driver overlay --subnet 10.1.0.0/16 --gateway=10.1.0.1 vxlan

需要注意指明overlay使用的宿主机器网卡

$cat /etc/systemd/system/docker.service
[Unit]
Description=Docker Application Container Engine
Documentation=http://docs.docker.com
After=network.target
Wants=docker-storage-setup.service
[Service]
Type=notify
EnvironmentFile=-/etc/sysconfig/docker
EnvironmentFile=-/etc/sysconfig/docker-storage
EnvironmentFile=-/etc/sysconfig/docker-network
Environment=GOTRACEBACK=crash
ExecStart=/usr/bin/docker daemon -H tcp://0.0.0.0:2375 -H unix:///var/run/docker.sock --registry-mirror=https://wfsgsp6x.mirror.aliyuncs.com --insecure-registry=my.reg $OPTIONS \
--insecure-registry my.reg2 \
--cluster-advertise=eth0:2376 --cluster-store etcd://XXX:2379/overtest \
$DOCKER_STORAGE_OPTIONS \
$DOCKER_NETWORK_OPTIONS \
$ADD_REGISTRY \
$BLOCK_REGISTRY \
$INSECURE_REGISTRY
LimitNOFILE=1048576
LimitNPROC=1048576
LimitCORE=infinity
MountFlags=shared
TimeoutStartSec=1min
Restart=on-failure
[Install]
WantedBy=multi-user.target

3.3 calico部署

部署
$echo "export ETCD_ENDPOINTS=http://XXXX:2379" >> /etc/profile
$source /etc/profile;calicoctl node --libnetwork
$source /etc/profile;calicoctl status
XXX:
calico-node container is running. Status: Up 48 seconds
IPv4 BGP status
IP:XXXX.37 AS Number: 64511 (inherited)
+--------------+-------------------+-------+----------+-------------+
| Peer address | Peer type | State | Since | Info |
+--------------+-------------------+-------+----------+-------------+
| XXXX.22 | node-to-node mesh | up | 06:04:52 | Established |
| XXXX.23 | node-to-node mesh | up | 06:04:52 | Established |
| XXXX.39 | node-to-node mesh | up | 06:04:52 | Established |
+--------------+-------------------+-------+----------+-------------+
使用docker的ipam driver 创建网络(支持端口暴露，不支持策略控制)
$docker network create --driver calico --opt nat-outgoing=true --opt ipip=false --subnet=10.10.0.0/22 vnet
$docker network create --driver calico --opt nat-outgoing=true --opt ipip=true --subnet=10.11.0.0/22 ipipnet
使用calico自己的IPAM（支持访问策略控制，不支持端口暴露）
$calicoctl pool add 100.100.1.0/24 --nat-outgoing
$calicoctl pool add 100.100.2.0/24 --nat-outgoing
$docker network create --driver calico --ipam-driver calico --subnet=100.100.1.0/24 vnet1
$docker network create --driver calico --ipam-driver calico --subnet=100.100.2.0/24 vnet2

发表在 System | 留下评论

升级PHP7

发表于2016/11/23由pm

之前网上都传PHP7得性能相对于PHP5有大幅的提升。简单做了一次升级


rpm -Uvh https://dl.fedoraproject.org/pub/epel/epel-release-latest-7.noarch.rpm

rpm -Uvh https://mirror.webtatic.com/yum/el7/webtatic-release.rpm

yum remove -y php-common &amp;&amp; yum install php70w-fpm php70w-opcache php70w-mysql

systemctl restart php-fpm

对比一下升级前后的首页cache不命中时RT变化 0.363s VS 0.097。
可以确定升级后的rt有大幅下降。

发表在 Admin | 留下评论

blog迁移的坑

发表于2016/11/21由pm

乘着双11的时候在阿里云买了一台vm，替换之前申请的AWS的机器。因此大陆访问AWS的机器实在是卡的不能用。。
此次乘着重新迁移，把wordpress部署写成了一个salt的sls文件。


www-data:

  user.present:

    - shell: /bin/false

    - createhome: False

  group.present:

    - addusers:

      - www-data

blog-pkgs:

  pkg.installed:

    - pkgs:

      - nginx

      - mariadb-server

      - php-fpm

      - php-mysql

      - php

      - tcpdump

{% for d in ["log/mysql","run/mysqld" ]: %}

/var/{{d}}:

  file.directory:

    - user: mysql

    - group: mysql

    - recurse:

      - user

      - group

    - makedirs: true

{% endfor %}

{% for d in [ "/var/log/nginx/","/var/cache/nginx","/var/lib/nginx/tmp/fastcgi"]: %}

{{d}}:

  file.directory:

    - user: www-data

    - group: www-data

    - makedirs:  true

    - require:

      - user: www-data

{% endfor %}

{% for f in ["dhparam.pem","server.crt.2016","server.key.2016"]: %}

/etc/nginx/cert/{{f}}:

  file.managed:

    - source: salt://base/conf/nginx/{{f}}

    - makedirs: true

{% endfor %}

mariadb:

  service.running:

    - enable: True

    - reload: True

    - watch:

      - file: mysql-conf

    - require:

      - file: mysql-conf

php-fpm:

  service.running:

    - enable: True

    - reload: True

    - watch:

      - file: php-conf

    - require:

      - file: php-conf

nginx:

  service.running:

    - enable: True

    - reload: True

    - watch:

      - file: /etc/nginx/conf.d/443.conf

    - require:

      - user: www-data

nginx_reload:

  cmd.wait:

    - name: systemctl reload nginx

    - watch:

      - file: /etc/nginx/conf.d/443.conf

      - file: /etc/nginx/nginx.conf

      - file: /etc/nginx/fastcgi_params

php_reload:

  cmd.wait:

    - name: systemctl reload php-fpm

    - watch:

      - file: php-conf

/etc/nginx/conf.d/443.conf:

  file.managed:

    - source: salt://base/conf/nginx/443.conf

    - template: jinja

/etc/nginx/nginx.conf:

  file.managed:

    - source: salt://base/conf/nginx/nginx.conf

    - template: jinja

/etc/nginx/fastcgi_params:

  file.managed:

    - source: salt://base/conf/nginx/fastcgi_params

    - template: jinja

mysql-conf:

  file.managed:

    - name: /etc/my.cnf

    - source: salt://base/conf/mysql/my.cnf

    - template: jinja

php-conf:

  file.managed:

    - name: /etc/php-fpm.d/www.conf

    - source: salt://base/conf/php/www.conf

    - template: jinja

[root@CentOS base]# cat init.sls

www-data:

  user.present:

    - shell: /bin/false

    - createhome: False

  group.present:

    - addusers:

      - www-data

blog-pkgs:

  pkg.installed:

    - pkgs:

      - nginx

      - mariadb-server

      - php-fpm

      - php-mysql

      - php

      - tcpdump

{% for d in ["log/mysql","run/mysqld" ]: %}

/var/{{d}}:

  file.directory:

    - user: mysql

    - group: mysql

    - recurse:

      - user

      - group

    - makedirs: true

{% endfor %}

{% for d in [ "/var/log/nginx/","/var/cache/nginx","/var/lib/nginx/tmp/fastcgi"]: %}

{{d}}:

  file.directory:

    - user: www-data

    - group: www-data

    - makedirs:  true

    - require:

      - user: www-data

{% endfor %}

{% for f in ["dhparam.pem","server.crt.2016","server.key.2016"]: %}

/etc/nginx/cert/{{f}}:

  file.managed:

    - source: salt://base/conf/nginx/{{f}}

    - makedirs: true

{% endfor %}

mariadb:

  service.running:

    - enable: True

    - reload: True

    - watch:

      - file: mysql-conf

    - require:

      - file: mysql-conf

php-fpm:

  service.running:

    - enable: True

    - reload: True

    - watch:

      - file: php-conf

    - require:

      - file: php-conf

nginx:

  service.running:

    - enable: True

    - reload: True

    - watch:

      - file: /etc/nginx/conf.d/443.conf

    - require:

      - user: www-data

nginx_reload:

  cmd.wait:

    - name: systemctl reload nginx

    - watch:

      - file: /etc/nginx/conf.d/443.conf

      - file: /etc/nginx/nginx.conf

      - file: /etc/nginx/fastcgi_params

php_reload:

  cmd.wait:

    - name: systemctl reload php-fpm

    - watch:

      - file: php-conf

      - file: /etc/php.ini

/etc/nginx/conf.d/443.conf:

  file.managed:

    - source: salt://base/conf/nginx/443.conf

    - template: jinja

/etc/nginx/nginx.conf:

  file.managed:

    - source: salt://base/conf/nginx/nginx.conf

    - template: jinja

/etc/nginx/fastcgi_params:

  file.managed:

    - source: salt://base/conf/nginx/fastcgi_params

    - template: jinja

mysql-conf:

  file.managed:

    - name: /etc/my.cnf

    - source: salt://base/conf/mysql/my.cnf

    - template: jinja

php-conf:

  file.managed:

    - name: /etc/php-fpm.d/www.conf

    - source: salt://base/conf/php/www.conf

    - template: jinja

/etc/php.ini:

  file.managed:

    - source: salt://base/conf/php/php.ini

迁移的过程中遇到几个问题：
1. 迁移有后会造成首页白屏幕。查了很久才发现是nginx配置文件内默认参数的差异导致。centos默认的fastcgi_param内没带SCRIPT_FILENAME。
解决方案，fastcgi_params内新增以下配置


fastcgi_param  SCRIPT_FILENAME    $document_root$fastcgi_script_name;

升级后我之前做的文章的缓存方案失效了。
curl看了一下，返回的header内有Cache-Control: no-store, no-cache, must-revalidate, post-check=0, pre-check=0和Pragma: no-cache的配置，并且还发了Set-Cookie的配置。


$curl -I https://blog.gnuers.org

HTTP/1.1 200 OK

Server: nginx/1.10.1

Date: Tue, 22 Nov 2016 02:19:41 GMT

Content-Type: text/html; charset=UTF-8

Connection: keep-alive

Vary: Accept-Encoding

X-Powered-By: PHP/5.4.16

Expires: Thu, 19 Nov 1981 08:52:00 GMT

Cache-Control: no-store, no-cache, must-revalidate, post-check=0, pre-check=0

Pragma: no-cache

Set-Cookie: PHPSESSID=p0r4lcqeqqa8fcog63esrq8686; path=/

Link: &lt;https://blog.gnuers.org/?rest_route=/&gt;; rel="https://api.w.org/"

Cache-status: MISS

Cache-Control: max-age=241

Strict-Transport-Security: max-age=63072000; includeSubdomains; preload

网上搜了一下确认这个是php.ini内的2个问题修改配置后搞定。


session.use_cookies = 0

session.cache_limiter = none

发表在 OS, saltstack | 留下评论

大规模内网DNS系统的瓶颈以及应对措施

发表于2016/11/10由pm

任何一个服务的规模达到一定量级都会出现各种瓶颈点，传统的IDC内部DNS也不例外。根据多年的实际经验把工作中遇到的点集成到了一个图。
主要瓶颈点：
1. DNS记录更新瓶颈
2. DNS同步瓶颈
3. DNS缓存应答瓶颈
4. DNS递归瓶颈

到底多大规模的内网DNS系统能称为大？个人定6个9标准：
1. IDC数量至少9个。
2. 域名全网生效SLA 9s内。
3. 一个IDC的DNS数量大于9台。
4. 调用DNS API的外部业务系统至少9个。
5. 单个机房DNS服务的范围超过9999台服务器。
6. DNS系统内的域名zone数量超过99个。

如果你管理的内网DNS系统规模满足一半以上的条件，想必你也会遇到各种奇葩的问题。从上图给出的几个瓶颈点出发几个优化的建议：

1. 控制外部API的调用并发，如果有的系统需要批量更新大量的域名，可以使用合并发送nsupdate操作的模式，注意单个nsupdate报文不要超过65535字节.

2. dns master服务器最好使用SSD服务器，因为nsupdate操作时zone文件的频繁会写非常消耗IO。

3. master上注意增大serial-query-rate以保证master的notify发送速度，估算值serial-query-rate >=slave规模*同时更新zone数量，实测发送速度可以超过2k/s。

4. master上增大transfers-out的值，需要>=slave规模*同时更新zone数量，

5. slave上transfers-in transfers-per-ns 需要大于本地zone的数量，否则导致新节点启动时因超过quota值部分zone会延迟半个小时以后再同步；slave 上serial-query-rate 超过本地zone的数量。

6. salve机器上常备dnstop分析实时流量。

7. salve服务器上如果有公网IP，务必配置好iptables，放置被当作反射器去攻击他人，并经常会有国安局、公安局领导约谈。

发表在 System | 留下评论

使用docker machine创建swarm集群

发表于2016/08/23由pm

准备干净的vm模版，clone出4台。ip规划如下
- enp0s3 外网网卡，桥接模式，dhcp
- enp0s8 内网网卡，bridge到bridge0(192.168.1.1/24)
打通centos-console 到其他几个服务区的信任登陆
- centos-console 192.168.1.10
- centos-test1 192.168.1.11
- centos-test2 192.168.1.12
- centos-test3 192.168.1.13
在跳板机器创建consul容器，做服务发现
docker run --restart=always -d -p 8500:8500 --name=consul progrium/consul -server -bootstrap
创建swarm-master
docker-machine create --driver generic --generic-ip-address 192.168.1.11 --generic-ssh-user root --engine-registry-mirror=https://wfsgsp6x.mirror.aliyuncs.com --engine-install-url=https://get.daocloud.io/docker/ --swarm --swarm-master --swarm-discovery="consul://192.168.1.10:8500" node-master
创建node
docker-machine create --driver generic --generic-ip-address 192.168.1.12 --generic-ssh-user root --engine-registry-mirror=https://wfsgsp6x.mirror.aliyuncs.com --engine-install-url=https://get.daocloud.io/docker/ --swarm --swarm-discovery="consul://192.168.1.10:8500" node-woker1
docker-machine create --driver generic --generic-ip-address 192.168.1.13 --generic-ssh-user root --engine-registry-mirror=https://wfsgsp6x.mirror.aliyuncs.com --engine-install-url=https://get.daocloud.io/docker/ --swarm --swarm-discovery="consul://192.168.1.10:8500" node-woker2
查看machine
[root@centos-console cert]# docker-machine ls
NAME ACTIVE DRIVER STATE URL SWARM DOCKER ERRORS
node-master - generic Running tcp://192.168.1.11:2376 node-master (master) v1.12.0
node-woker1 - generic Running tcp://192.168.1.12:2376 node-master v1.12.0
node-woker2 - generic Running tcp://192.168.1.13:2376 node-master v1.12.0
登陆管理
docker -H 192.168.1.11:3376 --tlsverify --tlscacert=/root/cert/ca.pem --tlscert=/root/cert/server.pem --tlskey=/root/cert/server-key.pem info

发表在 docker, System | 留下评论

目标

测试环境硬件

测试环境软件

测试的compose

1. calico compose

2. overlay compose

3. host compose

测试结果

1. host

2. calico

3. vxlan

使用calico的ipam dirver创建网络

创建容器测试

说明

1. docker网络现状

2. 尝试过的docker网络方案

2.1 calico方案

2.2 官方overlay的方案

3. 部署案例

3.1 swarm部署

3.2 官方overlay部署

3.3 calico部署

近期文章

近期评论

归档

分类

其他操作

blog

友情链接

有用的网站