数据中心

数据中心帮助文档

2019-11-01

1、参考文档:数据中心集群使用方法和PBS常用语法简介

2、 参考文档:PBS环境中使用VNC

3、2020年7月用户培训文档:FAST高性能集群作业调度及集群使用介绍

4、用户与国台所级中心签订协议:FAST 数据中心服务项目预约操作指南

 

数据中心常见问题:

1、发现集群登陆不上,出现 Permission denied (publickey,gssapi-keyex,gssapi-with-mic)

      (1) 确认自己是否修改过本机的公钥,造成集群上的公钥和集群公钥不匹配;

      (2) 确认自己是否修改过集群上自己用户主目录的权限,默认是700,如果改成其他的可能会造成无法登陆的情况。

2、已经授权读取了某个项目的数据,自己的用户账户(id username 查看)也已经在该附加组中,为何在读取时出任然现了Permission denied 的提示?

      解决方式: 查看自己用户账户所属的附加组(id username )个数是否已经超过了16个,因为NFS 文件系统的限制,用户所属附加组不能超过16个,如果已经超过16个,需要使用sg 命令,例如:sg - F3045 , 然后在ls /data31/3045 即可读取。

3、已经登录到mu01之后,执行了某些操作,然后出现了Resource temporarily unavailable 报错,然后就无法在登陆集群,登陆时会显示 No child processes 报错。

       这是因为我们集群使用PBS 作业调度,需要用户通过PBS 提交作业, 登陆节点mu01 不允许用户直接跑程序,或是打开类似IDL 等自己安装的软件包。我们在mu01设置了 限制用户使用的 nproc  (进程数) ,目前这个参数的设置是 24。如果你已经出现了这个问题,需要联系数据中心管理员杀死你在mu01上的进程。所以请不要直接在mu节点运行程序。