Fork me on GitHub
Suzf  Blog

Zabbix之监控Oracle性能

Orabbix 是一个用来监控 Oracle 数据库实例的 Zabbix 插件。

下载地址:http://www.smartmarmot.com/product/orabbix/download/

官方参考:http://www.smartmarmot.com/wiki/index.php/Orabbix

Orabbix插件的安装与配置

确保安装jdk环境,java version查看

[[email protected] ~]# java -version

java version "1.6.0_28"

OpenJDK Runtime Environment (IcedTea6 1.13.0pre) (rhel-1.66.1.13.0.el6-x86_64)

OpenJDK 64-Bit Server VM (build 23.25-b01, mixed mode)

Apache的工作模式及切换

prefork的工作原理及配置
  如果不用“--with-mpm”显式指定某种MPM,prefork就是Unix平台上缺省的MPM。它所采用的预派生子进程方式也是Apache 1.3中采用的模式。prefork本身并没有使用到线程,2.0版使用它是为了与1.3版保持兼容性;另一方面,prefork用单独的子进程来处理不同的请求,进程之间是彼此独立的,这也使其成为最稳定的MPM之一。

  若使用prefork,在make编译和make install安装后,使用“httpd -l”来确定当前使用的MPM,应该会看到prefork.c(如果看到worker.c说明使用的是worker MPM,依此类推)。再查看缺省生成的httpd.conf配置文件,里面包含如下配置段:

 

StartServers 5

MinSpareServers 5

MaxSpareServers 10

MaxClients 150

MaxRequestsPerChild 0

 

  prefork的工作原理是,控制进程在最初建立“StartServers”个子进程后,为了满足MinSpareServers设置的需要创建一 个进程,等待一秒钟,继续创建两个,再等待一秒钟,继续创建四个……如此按指数级增加创建的进程数,最多达到每秒32个,直到满足 MinSpareServers设置的值为止。这就是预派生(prefork)的由来。这种模式可以不必在请求到来时再产生新的进程,从而减小了系统开销 以增加性能。

  MaxSpareServers设置了最大的空闲进程数,如果空闲进程数大于这个值,Apache会自动kill掉一些多余进程。这个值不要设得过 大,但如果设的值比MinSpareServers小,Apache会自动把其调整为MinSpareServers+1。如果站点负载较大,可考虑同时 加大MinSpareServers和MaxSpareServers。

  MaxRequestsPerChild设置的是每个子进程可处理的请求数。每个子进程在处理了“MaxRequestsPerChild”个请求后 将自动销毁。0意味着无限,即子进程永不销毁。虽然缺省设为0可以使每个子进程处理更多的请求,但如果设成非零值也有两点重要的好处:

  ◆ 可防止意外的内存泄漏;

  ◆ 在服务器负载下降的时侯会自动减少子进程数。

  因此,可根据服务器的负载来调整这个值。个人认为10000左右比较合适。

  MaxClients是这些指令中最为重要的一个,设定的是Apache可以同时处理的请求,是对Apache性能影响最大的参数。其缺省值150是 远远不够的,如果请求总数已达到这个值(可通过ps -ef|grep http|wc -l来确认),那么后面的请求就要排队,直到某个已处理请求完毕。这就是系统资源还剩下很多而HTTP访问却很慢的主要原因。系统管理员可以根据硬件配置 和负载情况来动态调整这个值。虽然理论上这个值越大,可以处理的请求就越多,但Apache默认的限制不能大于256。如果把这个值设为大于256,那么 Apache将无法起动。事实上,256对于负载稍重的站点也是不够的。在Apache 1.3中,这是个硬限制。如果要加大这个值,必须在“configure”前手工修改的源代码树下的src/include/httpd.h中查找 256,就会发现“#define HARD_SERVER_LIMIT 256”这行。把256改为要增大的值(如4000),然后重新编译Apache即可。在Apache 2.0中新加入了ServerLimit指令,使得无须重编译Apache就可以加大MaxClients。下面是prefork配置段:

 

StartServers 10

MinSpareServers 10

MaxSpareServers 15

ServerLimit 2000

MaxClients 1000

MaxRequestsPerChild 10000

 

  上述配置中,ServerLimit的最大值是2000,对于大多数站点已经足够。如果一定要再加大这个数值,对位于源代码树下server/mpm/prefork/prefork.c中以下两行做相应修改即可:

#define DEFAULT_SERVER_LIMIT 256

#define MAX_SERVER_LIMIT 2000

worker的工作原理及配置

  相对于prefork,worker是2.0 版中全新的支持多线程和多进程混合模型的MPM。由于使用线程来处理,所以可以处理相对海量的请求,而系统资源的开销要小于基于进程的服务器。但 是,worker也使用了多进程,每个进程又生成多个线程,以获得基于进程服务器的稳定性。这种MPM的工作方式将是Apache 2.0的发展趋势。

  在configure -with-mpm=worker后,进行make编译、make install安装。在缺省生成的httpd.conf中有以下配置段:

 

StartServers 2

MaxClients 150

MinSpareThreads 25

MaxSpareThreads 75

ThreadsPerChild 25

MaxRequestsPerChild 0

 

  worker的工作原理是,由主控制进程生成“StartServers”个子进程,每个子进程中包含固定的ThreadsPerChild线程数, 各个线程独立地处理请求。同样,为了不在请求到来时再生成线程,MinSpareThreads和MaxSpareThreads设置了最少和最多的空闲 线程数;而MaxClients设置了所有子进程中的线程总数。如果现有子进程中的线程总数不能满足负载,控制进程将派生新的子进程。

  MinSpareThreads和MaxSpareThreads的最大缺省值分别是75和250。这两个参数对Apache的性能影响并不大,可以按照实际情况相应调节。

  ThreadsPerChild是worker MPM中与性能相关最密切的指令。ThreadsPerChild的最大缺省值是64,如果负载较大,64也是不够的。这时要显式使用 ThreadLimit指令,它的最大缺省值是20000。上述两个值位于源码树server/mpm/worker/worker.c中的以下两行:

#define DEFAULT_THREAD_LIMIT 64

#define MAX_THREAD_LIMIT 20000

  这两行对应着ThreadsPerChild和ThreadLimit的限制数。最好在configure之前就把64改成所希望的值。注意,不要把这两个值设得太高,超过系统的处理能力,从而因Apache不起动使系统很不稳定。

  Worker模式下所能同时处理的请求总数是由子进程总数乘以ThreadsPerChild值决定的,应该大于等于MaxClients。如果负载 很大,现有的子进程数不能满足时,控制进程会派生新的子进程。默认最大的子进程总数是16,加大时也需要显式声明ServerLimit(最大值是 20000)。这两个值位于源码树server/mpm/worker/worker.c中的以下两行:

#define DEFAULT_SERVER_LIMIT 16

#define MAX_SERVER_LIMIT 20000

  需要注意的是,如果显式声明了ServerLimit,那么它乘以ThreadsPerChild的值必须大于等于MaxClients,而且 MaxClients必须是ThreadsPerChild的整数倍,否则Apache将会自动调节到一个相应值(可能是个非期望值)。下面是 worker配置段:

 

StartServers 3

MaxClients 2000

ServerLimit 25

MinSpareThreads 50

MaxSpareThreads 200

ThreadLimit 200

ThreadsPerChild 100

MaxRequestsPerChild 0

 

  通过上面的叙述,可以了解到Apache 2.0中prefork和worker这两个重要MPM的工作原理,并可根据实际情况来配置Apache相关的核心参数,以获得最大的性能和稳定性。

如何切换apache2的prefork和worker模式

问题

  在Prima/Plesk/Virtuozzo上,apache都使用了系统自带的httpd-2.0.5x的rpm包

  在redhat linux上,默认使用的是prefork模式,而不是worker模式

  如何在二者间切换?

解决方案

  Apache HTTP服务器被设计为一个强大的、灵活的能够在多种平台以及不同环境下工作的服务器。

  不同的平台和不同的环境经常产生不同的需求,或是为了达到同样的最佳效果而采用不同的方法。

  Apache凭借它的模块化设计很好的适应了大量不同的环境。

  这一设计使得网站管理员能够在编译时和运行时凭借载入不同的模块来决定服务器的不同附加功能。

  Apache2.0将这种模块化的设计延伸到了web服务器的基础功能上。

  这个版本带有多路处理模块(MPM)的选择以处理网络端口绑定、

  接受请求并指派子进程来处理这些请求。

  比如,需要更好伸缩性的可以选择象worker或event这样线程化的MPM,

  而需要更好的稳定性和兼容性以适应一些旧的软件可以用prefork 。

  在Redhat Linux的主要版本as4上,apache版本为httpd-2.0.5x,

  默认为prefork模式,主要是考虑到稳定性的原因。

  要切换到worker模式,则需要登录到linux上,进行如下操作:

  进入/usr/sbin目录

  cd /usr/sbin

  将当前的prefork模式启动文件改名

  mv httpd httpd.prefork

  将worker模式的启动文件改名

  mv httpd.worker httpd

  修改配置文件vi /etc/httpd/conf/httpd.conf

  找到里边的如下一段,可适当修改负载等参数:

  StartServers 5
ThreadLimit 200
ServerLimit 50
MaxClients 2000
MinSpareThreads 25
MaxSpareThreads 200
ThreadsPerChild 100
MaxRequestsPerChild 50

  重新启动服务

  /etc/init.d/httpd restart

  即可换成worker方式启动apache2

 

Zabbix之监控Mysql性能

Zabbix还可以监控mysql slow queries,mysql version,uptime,alive等。下面通过Zabbix Graphs实时查看的SQL语句操作情况和mysql发送接收的字节数。
1.Zabbix官方提供的监控mysql的模板Template App MySQL,可以看到相关的Items和key。

2. 把该模板Template App MySQL Link到相关的主机上面,发现Item的Status是不可用的,因为key的值是通过Mysql用户查看"show global status"信息或者用mysqladmin命令查看status或extended-status的信息而取的值。

mysql> show global status;


3.创建只读 账户zabbix

mysql> insert into mysql.user(Host,User,Password)values("localhost","zabbix",password("yourpasswd"));
mysql> update mysql.user set Select_priv="Y" where user="zabbix" and HOST="localhost";
mysql>flush privileges;
# mysqladmin -uzabbix -p status
Uptime: 3023456 Threads: 16 Questions: 941201 Slow queries: 0 Opens: 491 Flush tables: 1 Open tables: 90 Queries per second avg: 0.311

4.结合官方提供的key编写Shell脚本,从数据库中取出Items的key的值。

# cat /usr/local/zabbix/scripts/checkmysqlperformance.sh

#!/bin/sh

#Modified by Jeffery Aug,18 2014
MYSQL_SOCK="/var/lib/mysql/mysql.sock"
#MYSQL_PWD=`cat /var/lib/mysql/3306/.mysqlpassword`
MYSQL_PWD=yourpasswd

ARGS=1

if [ $# -ne "$ARGS" ];then
echo "Please input one arguement:"
fi

case $1 in
Uptime)
result=`mysqladmin -uzabbix -p${MYSQL_PWD} -S $MYSQL_SOCK status|cut -f2 -d":"|cut -f1 -d"T"`
echo $result
;;

Com_update)
result=`mysqladmin -uzabbix -p${MYSQL_PWD} -S $MYSQL_SOCK extended-status |grep -w "Com_update"|cut -d"|" -f3`
echo $result
;;

Slow_queries)
result=`mysqladmin -uzabbix -p${MYSQL_PWD} -S $MYSQL_SOCK status |cut -f5 -d":"|cut -f1 -d"O"`
echo $result
;;

Com_select)
result=`mysqladmin -uzabbix -p${MYSQL_PWD} -S $MYSQL_SOCK extended-status |grep -w "Com_select"|cut -d"|" -f3`
echo $result
;;

Com_rollback)
result=`mysqladmin -uzabbix -p${MYSQL_PWD} -S $MYSQL_SOCK extended-status |grep -w "Com_rollback"|cut -d"|" -f3`
echo $result
;;

Questions)
result=`mysqladmin -uzabbix -p${MYSQL_PWD} -S $MYSQL_SOCK status|cut -f4 -d":"|cut -f1 -d"S"`
echo $result
;;

Com_insert)
result=`mysqladmin -uzabbix -p${MYSQL_PWD} -S $MYSQL_SOCK extended-status |grep -w "Com_insert"|cut -d"|" -f3`
echo $result
;;

Com_delete)
result=`mysqladmin -uzabbix -p${MYSQL_PWD} -S $MYSQL_SOCK extended-status |grep -w "Com_delete"|cut -d"|" -f3`
echo $result
;;

Com_commit)
result=`mysqladmin -uzabbix -p${MYSQL_PWD} -S $MYSQL_SOCK extended-status |grep -w "Com_commit"|cut -d"|" -f3`
echo $result
;;

Bytes_sent)
result=`mysqladmin -uzabbix -p${MYSQL_PWD} -S $MYSQL_SOCK extended-status |grep -w "Bytes_sent" |cut -d"|" -f3`
echo $result
;;

Bytes_received)
result=`mysqladmin -uzabbix -p${MYSQL_PWD} -S $MYSQL_SOCK extended-status |grep -w "Bytes_received" |cut -d"|" -f3`
echo $result
;;

Com_begin)
result=`mysqladmin -uzabbix -p${MYSQL_PWD} -S $MYSQL_SOCK extended-status |grep -w "Com_begin"|cut -d"|" -f3`
echo $result
;;

*)
echo "Usage:$0(Uptime|Com_update|Slow_queries|Com_select|Com_rollback|Questions)"
;;

esac

4.在Zabbix_agentd.conf里面添加UserParameter,格式如下,对于Zabbix来说,脚本其实就是一个插件。

# cat /usr/local/zabbix/etc/zabbix_agentd.conf| grep -v "^$\|^#"

LogFile=/tmp/zabbix_agentd.log

Server=172.16.9.38

ServerActive=172.16.9.38:10051

Hostname=172.16.9.26

UnsafeUserParameters=1

UserParameter=mysql.version,mysql -V

UserParameter=mysql.ping,mysqladmin -uzabbix -p\[email protected] -S /var/lib/mysql/mysql.sock ping | grep -c alive

UserParameter=mysql.status[*],/usr/local/zabbix/scripts/checkmysqlperformance.sh $1

5.重启agentd服务器

/etc/init.d/zabbix_agentd restart

6.然后在zabbix server用zabbix_get就可以取到key的值。

# /usr/local/zabbix/bin/zabbix_get -s 172.16.9.26 -p10050 -k mysql.status[Uptime]
3386849

# /usr/local/zabbix/bin/zabbix_get -s 172.16.9.26 -p10050 -k mysql.status[Com_select]
275188

6.在zabbix前端可以实时查看SQL语句每秒钟的操作次数。

7.在zabbix前端可以实时查看mysql发送接收的字节数。其中bytes received表示从所有客户端接收到的字节数,bytes sent表示发送给所有客户端的字节数。

总结:
1)把该脚本放到要监控的服务器上面(Modify mysql user and password),修改UserParameter的参数并重启agentd,Link官方提供的Template App MySQL模板即可。
2)我这里是测试环境用的是新创建的只读账户zabbix,线上服务器安全期间可以给mysql用户授权readonly权限。

3)根据实际的需求,除了监控上述监控项之外,还可以监控mysql processlist,Innodb等。

 

Zabbix 之自动发现规则

1、 打开configure--Discovery--create discovery rule:

需要添加名称,ip地址段(这个地址段以覆盖你所有IP的最小地址段为好),checks。其中checks最为重要,总共三项,只填写key,这里用 system.uname这个key。然后点击添加并保存。这里的意思是zabbix服务器端扫描这个网段中的zabbix客户端(客户端端口默认为 10050),扫描到之后取客户端的system.uname值,这个值返回的类似于linux系统中的uname –a命令,值为下面形式:

[[email protected] ~]# /usr/local/zabbix/bin/zabbix_get -s192.168.8.29 -ksystem.uname
Linux *.*.com 2.6.32-431.el6.x86_64 #1 SMP Fri Nov 22 03:15:09 UTC 2013 x86_64

这个主要用于发现主机之后把主机自动分配到相应的组(比如linux组或是windowns组)中,并且应用相应的监控模板。

当然,这个key值不一定要用system.uname,也可以用其他的key,首先zabbix客户端支持这个key,在这用这个key可以区分不同类型的主机方便分组应用监控模板。

2.打开zabbix的系统配置---action--Event source —create action:

发现规则

关联模板

这 几项的意思是当自动发现通过发现zabbix客户端,并且接收到key的中包含linux字符,即把他添加到linux_servers组中,应用 linux_server模板。等一段时间即可查看自动发现的结果。结果可以在zabbix首页中最下面有状态,也可以在zabbix的状态统计---自 动发现中查看,可以看到发现了多少,监控了多少。

然后查看hostname 是否和agentd.conf中相一致

到此为止,zabbix的监控设置说明完毕。

在Monitoring中的Discovery中会出现发现的主机

 

Zabbix 之自定义Key

1、监控进程
/usr/local/zabbix/bin/zabbix_get -s 127.0.0.1 -k “net.tcp.service[http]”

2、监控端口
/usr/local/zabbix/bin/zabbix_get -s 127.0.0.1 -k “net.tcp.port[,80]” 结果:1存在,0不存在;

3、进程数量
/usr/local/zabbix/bin/zabbix_get -s 127.0.0.1 -k “proc.num[]”
/usr/local/zabbix/bin/zabbix_get -s 127.0.0.1 -k “proc.num[httpd]”

4、其他
vm.memory.size[available]
vfs.file.cksum[/etc/passwd]
system.cpu.switches
system.cpu.num
system.cpu.util[,user]
system.cpu.util[,nice]
system.cpu.util[,system]
system.cpu.util[,iowait]
system.cpu.util[,idle]
system.cpu.util[,interrupt]
system.cpu.util[,steal]
system.cpu.util[,softirq]
system.swap.size[,free]
system.swap.size[,pfree]
system.boottime
system.localtime
system.hostname
system.cpu.intr
kernel.maxfiles
kernel.maxproc
system.users.num
proc.num[]
proc.num[,,run]
system.cpu.load[percpu,avg1]
system.cpu.load[percpu,avg5]
system.cpu.load[percpu,avg15]
system.uname
system.uptime
vm.memory.size[total]
system.swap.size[,total]
net.tcp.service[ftp,,155]
net.tcp.service[http]
net.tcp.service.perf[http,,8080]
net.tcp.service[service,, ]

 

How-to: Disabling Hyper-threading on a Dell PE R730

Q:I need to disable hyper-threading due to licensing issues but, I can't find the setting in the BIOS that would allow me to disable it. Does anyone know where I can find the setting on a Dell PowerEdge R730?

A: The BIOS option is called “Logical Processors”. See the manual ftp://ftp.dell.com/Manuals/Common/poweredge-r720_Owner's%20Manual_en-us.pdf

And you can run `lscpu` to check the current BIOS configure

逻辑处理器;

启用或禁用逻辑处理器和显示逻辑处理器的数量。如果 Logical Processor
( 逻辑处理器) 选项设置为 Enabled( 已启用), BIOS 将显示所有逻辑处
理器。如果此选项设置为 Disabled( 已禁用), 则 BIOS 对每个核心仅显示
一个逻辑处理器。默认情况下, Logical Processor( 逻辑处理器) 选项设置
为 Enabled( 已启用) 。

dell.community : http://en.community.dell.com/support-forums/servers/f/956/t/19453790

Zbbix之邮件报警

本次内容就介绍一下如何的在zabbix里进行邮件报警,并且自定义邮件报警的格式。

1.选择“Administration-Media types“

选择“Email“

输入相应信息

然后保存

2.选择“Administration-Users“

选择“users“,然后在选择”admin“用户

在选择“Media”,选择“Add”

输入相应的信息,其中第一行类型是刚才配置的“示警媒体类型”。

然后选择保存

3.选择“Configuration-Actions-create action”

具体配置如下

动作界面内容为

条件界面内容为

操作界面内容为

然后保存

4.在zabbix的服务端,一定要有mta端,也就是sendmail或者postfix,然后启动他们。

通过以上的设置,就可以实现zabbix邮件报警了,下面介绍如何的自定义报警内容信息。

5.测试

模拟故障触发trigger,查看报警功能是否正确配置

选择“Monitoring-Events-Trigger”

如果看到OK那么报配置完成,如果是failed 请重新检测以上配置。

如果想定义其他的格式,可以参考https://www.zabbix.com/documentation/1.8/manual/config/macros

 

How-to fix SNMPD daemon fails to start

SNMPD daemon fails to start

Symptoms

The 'service snmpd start' command does not return any error, but 'ps auxw | grep snmpd' command shows that the SNMPD daemon is not running.

/var/log/snmpd.log shows:
getaddrinfo("IP_Address", NULL, ...): Address family for hostname not supported
Error opening specified endpoint "IP_Address:161"
Server Exiting with code 1

We should check that nothing in /etc/default/snmpd or /etc/sysconfig/snmpd.options is over-riding your configuration.
I think by default, the local loopback address (127.0.0.1) is passed in the SNMPDOPTS directive.
if yes, Remove the unknown IP_Address:161 from the SNMPDOPTS

now start the snmpd again.