`
yunnick
  • 浏览: 389632 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

Mysql双机异常及解决方案

阅读更多

今天Mysql双机遇到两个问题,从网上整理下解决方案,记录下来:

 

通过以下命令行可查看异常信息

 

mysql> show slave status\G;

 具体细节可查看Mysql日志。

 

问题一:

 命令行报错如下

 Slave_IO_Running: No
 Slave_SQL_Running: Yes

Last_IO_Errno: 1236
Last_IO_Error: Got fatal error 1236 from master when reading data from binary log: 'Client requested master to start replication from impossible position; the first event 'mysql-bin.000073' at 662720845, the last event read from './mysql-bin.000073' at 4, the last byte read from './mysql-bin.000073' at 4.'

从字面理解就是,从服务器请求了主服务器的一个错误的复制位置。比如主服务器上的BLIN_LOG里没有这个POSITION.

解决办法:

首先查看主服务器的日志文件中是否有此行,使用命令

 

mysqlbinlog  /LogPath/mysql-bin.000073 >> log

 在log文件里查找662720845对应的行或者和这个数字接近的行(先从小的试试,无法恢复再从大的试),  

  log文件内容类似:

# at 662720839

#130614  8:36:01 server id 1  end_log_pos 662720860	Query	thread_id=207498	exec_time=0	error_code=0
SET TIMESTAMP=1371170161/*!*/;
COMMIT
/*!*/;
DELIMITER ;
 

 然后重新设置复制位置,如下 

mysql>stop slave;
mysql> change master to
    -> master_log_file='mysql-bin.000073',
    -> master_log_pos=662720860;
mysql> start slave;

如果找不到,可用如下命令查看mysql-bin.000073的最大位置

ls -la mysql-bin.000073

 如果大小远小于662720845,则可以跳过这个日志,从下个日志开始复制。

mysql>stop slave;
mysql> change master to
    -> master_log_file='mysql-bin.000074',
    -> master_log_pos=4;
mysql> start slave;

 重设复制起始点可能遇到问题二,具体解决方法可参考问题二。

 

问题二:

  错误代码如下

  mysql slave Error_code: 1062  1054

  如果日志中出现了这样代码,可能是错误的select,或update操作,master是跳过这些操作,但是被记录到了二进制日志中,slave会依据二进制中的语句做相同的动作,就会报错,知道原理了要做的操作就很简单了。

  解决方法

stop slave;  
set global  sql_slave_skip_counter=n;    //n为你想跳过错误语句的个数  
start slave;  
如果你不想再遇到这种错误,可以写到slave配置文件中格式如下:
slave_skip_errors = 1062 
slave_skip_errors = all   //跳过所有类型的错误码  

 

 

 问题三:

 错误代码如下

  Slave_IO_Running: Yes
  Slave_SQL_Running: No

  Last_SQL_Errno: 1594
  Last_SQL_Error: Relay log read failure: Could not parse relay log event entry. The possible reasons are: the master's binary log is corrupted (you can check this by running 'mysqlbinlog' on the binary log), the slave's relay log is corrupted (you can check this by running 'mysqlbinlog' on the relay log), a network problem, or a bug in the master's or slave's MySQL code. If you want to check the master's binary log or slave's relay log, you will be able to know their names by issuing 'SHOW SLAVE STATUS' on this slave.

 

以上异常可能由内存溢出或者硬盘空间不足导致。

 解决办法

从最近一次复制结束的位置复制即可

show slave status \G; 
  Master_Log_File: mysql_master-bin.000164
  Read_Master_Log_Pos: 980240603
 Relay_Log_File: slave2-relay-bin.000001
 Relay_Log_Pos: 251111
  Relay_Master_Log_File: mysql_master-bin.000164
   Exec_Master_Log_Pos: 980240603
stop slave;
CHANGE MASTER TO  MASTER_LOG_FILE = 'mysql_master-bin.000164',MASTER_LOG_POS =980240603;
start slave ;
 
 如果问题一和问题三同时出现,先改问题三

 

 

问题四:

错误代码:
1205
Lock wait timeout exceeded; try restarting transaction 

解决办法:

原因:mysql的innodb是独占锁。

解决的办法有两个:

第一:innodb_lock_wait_timeout 锁定等待时间改大

my.ini文件:
#innodb_lock_wait_timeout = 50

修改为

innodb_lock_wait_timeout = 500

第二:把多个查询合并为一个查询执行,可以避免等待解锁时间。前面一个查询执行完毕后后面一个查询获得独占锁并执行。

 

 

备注:

         mysql replication 中slave机器上有两个关键的进程,死一个都不行,一个是slave_sql_running,一个是Slave_IO_Running,一个负责自己的slave mysql进程,一个负责与主机的io通信。
         如果是slave_io_running no了,可能有三种情况,一个是网络有问题,第二个是有可能my.cnf有问题,最后一个是授权的问题,replication slave和file权限是必须的。
         一旦io为no了先看err日志,看看报什么错,很可能是网络,也有可能是包太大收不了,这个时候主备上改max_allowed_packet这个参数。
        如果是slave_sql_running no了,那么也有两种可能,一种是slave机器上这个表中出现了其他的写操作,就是程序写了,这个是会有问题的,还有一种占绝大多数可能的是slave进程重启,事务回滚造成的,这也是mysql的一种自我保护的措施,像关键时候只读一样。 这个时候想恢复的话,只要停掉slave,set GLOBAL SQL_SLAVE_SKIP_COUNTER=1;(参考问题二解决方法),再开一下slave就可以了
 
 
 
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics