亿邮公司介绍
北京亿中邮信息技术有限公司 (以下简称亿邮),成立于 1999 年 , 经过十多年的高速发展,形成了一支拥有各类精英人才近200人,为全国各行各业 5000余家客户提供互联网整体通信解决方案及技术支持服务的高效团队。
截至目前, 亿邮已拥有:亿邮电子邮件系统、亿邮邮件网关系统、 亿邮即时通信系统、 亿邮邮件归档系统、亿邮校友邮箱系统等具有世界领先水平的软件产品,为客户提供着最专业化的解决方案。
.jpg)
亿邮全系列软件结构
II 亿邮邮件系统、校友邮箱介绍
II.1 亿邮邮件系统技术特点简介
eYou公司专注于邮件系统平台及相关应用的研发,充分利用公司业界领先的技术成果,引进国外技术,开发了百万千万级大型电子邮件系统平台。该系统于2000年初成功投入市场,迅速在全国大中院校、知名企业、电信系统得到应用。该系统支持全部主流邮件协议,全部技术完全由亿中邮公司自主开发,拥有独立版权,利用业界领先的技术手段优化系统,达到高速检索定位,例如在百万级用户情况下,定位用户目录时间可达毫秒级。
1:冗余分布式系统设计,系统模块分布式部署支持超大用户
亿邮邮件系统系统的建立严格遵循软件工程规范。采用冗余分布式系统设计,这种全分布式体系结构可以将每个功能模块都安装在单独的主机上,并将系统的整体性能大幅提高,尤其是在系统对并发处理的能力方面更是单一服务器所望尘莫及的。当系统服务器集群中的一台服务器发生问题导致无法继续提供服务的时候,其他服务器首先能够保持独立的正常工作,并能检测到故障服务器出现问题,接管故障服务器的工作,直到故障排除再将工作返回给故障服务器。
2:用户表现层和系统底层程序、数据完全分离,该套统一数据交换接口也可以供授权第三方调用。
为了尽最大可能满足用户对于表现层的变更需求,同时,在满足上述需求的同时,不必要进行底层程序调整。引发大规模的改动。亿邮采取了内部的数据交换标准。实现了用户表现层通过该统一数据接口进行数据交换。完全分离,基于表现层的任何改动均不涉及底层程序,彻底将表现层的工作交给web页面工程师进行处理。
3:基于自主研发的MTA采用PreFork技术实现大并发访问支持
亿邮系统设计了请求调度器,将用户请求按照一定算法分配给预先生成的多个守候进程/线程。相对于传统进程技术,Pre Fork避免了系统生成/结束进程/线程时消耗的大量调度时间。多守候进程/线程可以充分利用系统资源。即能在最短时间内响应大量的突发用户请求,又能充分的利用进程间隔离保护特性达到多并发下的稳定可靠性。
4:File Damon支持后台存储文件系统的多样性
亿邮邮件系统后台存储可以是sun的低端服务器(ufs)、安装linux的pc server(ext2,ext3)等不同类型。所有数据的写入,读出均通过亿邮的文件处理服务器进行。广泛的支持了后台的存储类型。使得用户的存储扩展非常方便,随时可以动态扩展存储设备。
5:通过亿邮存储系统分布式散列算法,实现邮件系统的实时备份。
目前市场上主流邮件提供商备份方案无非完全备份和增量备份两种方式,这样的好处是在第一次备份施工时进行完整备份后,每天的备份数据量大幅度降低,只需同步上次备份以来发生变化的数据。但是对于超大型邮件系统来说,找出发生变化的数据是非常耗时的。通过亿邮邮件存储系统分布式散列算法可以让管理员通过备份管理界面轻松实现实时备份,而无需遍历整个文件系统找出数据变化量后才能进行真正的数据备份过程。
II.2 校友邮箱简介
校友邮箱作为一种学校和离校校友之间的纽带最近日益受到青睐。越来越多的学校不再将离校学生邮箱删除,而是转为校友邮箱继续为校友提供服务。这样一方面使学生不至于因为毕业而丢失常用的邮件联络渠道,一方面使学校能够更长久的与校友保持沟通,为将来的校友返校,同学聚会,继续为母校出力等活动创造了条件。
亿邮根据上述需求,通过亿邮大容量电子邮件系统的改造提出了完整的技术方案。
1、从部署模式上亿邮提供两种建设模式
基于一套域名
例如@your-domain.edu.cn
毕业后自动/手动转换学生身份
通过自动模板技术根据学生身份不同调用不同的页面设计
基于两套域名
例如在校师生@your-domain.edu.cn
校友域名变更为@alumni.your-domain.edu.cn
毕业后批量导入校友信息
2、功能上提供学生身份自动转换、公共存储空间、班级通讯录、联系方式变更自动同步等贴近实际的功能。
III 邮件网关介绍
III.1 亿邮邮件网关技术特点简介
eYou公司自2001年开始投入大量技术人员进行反垃圾邮件的识别和病毒邮件的查杀。也与多家世界知名的杀毒引擎公司进行了全方面的合作,比如金山、兰锐、赛门铁克、卡巴斯基等。与此同时,也积累了丰富的病毒引擎整合的开发技术。由于同时拥有完整的底层邮件和反垃圾邮件处理技术,两套产品融合性极佳。
1:基于TCP连接活动和惩罚制度的网络层阻断技术
亿邮在TCP层实现了对垃圾邮件活动特征进行识别的突破。这种技术能够在不依赖任何列表的情况下识别超过70%的垃圾邮件发送请求并逐步降低其TCP并发连接数目直至其彻底被拦截。
2:针对邮件活动特征的动态行为统计识别技术
亿邮通过分析建模,建立了一个垃圾邮件行为模型。该模型能够在邮件发送的过程中动态跟踪其各种阶段的行为特征。最终对其垃圾邮件的符合度进行有效评判。具有效率高,识别率高,误判率低,并且不依赖任何静态库的优点。
3:基于统计算法的语义分析技术
亿邮采用了逆向匹配算法,并针对电子邮件内容的特点,对其特殊的字符集以及符号进行了处理。最终做到了准确而高效的分词。能够反映语义的统计数学模型。亿邮在传统朴素贝叶斯算法的基础上,增加了搜索算法中的词语便宜量指标以及HTML格式分析技术。
4:EYOU-SPAM-DNA 技术
SPAM-DNA技术通过对垃圾邮件的多种行为以及内容规律,自动建立垃圾邮件的DNA库并应用于未来的垃圾邮件识别。而基于垃圾邮件"基因"的技术则可以对邮件信息的底层结构和邮件内容进行分析,从邮件性质上对垃圾邮件进行预测,在第一时间阻止垃圾邮件的肆虐传播。该技术目前仍处于探索阶段,其初期的模型已经表现出一定的智能化,但该技术仍然需要一定的时间和投入进行优化。
5:智能快速图像附件分析技术
图形垃圾邮件是目前最能有效规避过滤机制的发送机制。亿邮独创多维模式识别技术,是跨多个纬度进行分析,分割图片更细致,引擎会从不同角度去解析,包括图片本身以及图片中干扰点的规则。这种技术是把变化当成规律的一部分,而IP地址、包头包尾信息、Web页面链接、图片本身像素、图片分割画面、干扰底层颜色变化,都是纬度之一。
6:高效的特征筛选技术
亿邮分类器通过提供的具有代表类别属性的特征进行学习获取知识,采用基于频率和最大互信息的特征提取方法,提高分类器的学习能力和智能水平。
7:可疑邮件意图分析技术
亿邮网关中的内容识别引擎改进了传统贝叶斯算法,采用符合自然语义的中文分词、特殊字符集处理、词语变异度指标、语气词应用及内嵌异常URL地址特征和上述信息的抗干扰等多项技术,增强了传统统计模型的准确性,通过基于boosting和最小代价的决策方法,保证了分类的精度和最优阀值的获取。
8:智能算法以及知识库的自动更新
经过几年来的市场积累,亿邮软件拥有极高产品覆盖率。尤其,反垃圾网关产品的算法和知识库的更新相对频繁。因此,亿邮技术部门专门成立部门维护中央服务器,用户全国客户服务器自动下载更新智能算法库以及知识库。
III.2 事实胜于雄辩
某电信客户邮件网关系统每天平均需要处理60万-100万封邮件。根据邮件网关系统某日报告,我们得到如下统计信息:
网络层统计信息如下:
系统网络连接数总计:220万余次
其中正常连接数:138万余次
亿邮邮件网关拦截非法连接数:82万余次
显然,亿邮邮件网关在大幅度降低后台邮件系统负载压力的前提下,为了充分保证邮件网关的性能,在TCP连接层我们做了大量的技术工作来保证将非法连接对SMTPD进程的冲击降低到最小。从而保证了亿邮邮件网关将硬件平台性能发挥到极致!
应用层统计信息如下:
系统收到邮件90万封
其中正常邮件12万封
被亿邮邮件网关拦截下来78万封。
超低的误判率:
我们充分认识到,一封被误判的正常信件会使十封垃圾邮件的判断失去意义。因此系统中对垃圾邮件的识别过程非常严谨,对于任何可能造成误判的环节我们都采取了相应的措施。对于任何出现的误判情况,亿邮都会安排专人进行分析,并及时修改识别引擎的设置和知识库,力争误判情况减到最小。
IV eYouIM介绍
基于市场需求,亿邮研发出一套集成在邮件系统中的即时通讯软件。eYouIM是一套无缝集成于亿邮邮件系统之中的即时通讯工具,也是亿邮邮件系统的自然延伸。
eYou IM是一款强大、稳定、高效率的商务型即时通讯软件,是一整套即时通讯软件中的客户端软件,它具有即时通讯、邮件管理、网络会议、文件传输、分组发送通知、单人(多人会议)历史消息查询等功能。能够有效的提高工作效率,节约企事业单位内部运营成本。 亿邮认为内嵌于邮件系统的即时通讯工具的出现并不会对邮件市场造成巨大的冲击,相反它将是邮件系统的一个有益的补充。而一般的互联网即时通讯产品都是面对互联网用户,用户之间并不存在关联。很难和企业邮件真正有效的结合起来。
1、缓存技术的高效应用
针对IM即时通讯软件的特点,eYouIM数据库设计采取了不同形式的数据采用不同的数据库进行存储。并辅助以大量的缓存技术来进一步提高数据中转的效率和速度。使得用户基于客户端、管理员基于web界面的操作更加的流畅、快捷。
下图为eYouIM数据库系统协作设计图示:
.jpg)
2:模块动态添加
在目前的软件应用中,不同的客户对于同一套软件会有不同的需求或者说功能组合,为了更好的服务客户,在本套eYouIM设计中我们提出了热代码替换技术,这样可以更好的适应这类需求,使得升级策略可在线进行。而用户再次重新登录后就能够体验新的功能。
3:协议转换模块
eYouIM设计了协议转换机制。通过对公开消息传递协议的IM进行数据转换后可以实现只登录一套eYouIM账号,即可以与这些采用了公开消息传递协议的IM进行互联互通。比较著名的有:MSN、Gtalk、YahooMessage、Skype 、Icq。
V 亿邮邮件归档系统介绍
V.1 邮件归档技术特点介绍
.jpg)
系统的各主要功能模块的作用是:
V.1.1 归档客户端
归档客户端程序在归档队列中扫描到邮件后,查询此邮件的发件人和收件人属性,确定发件人和收件人是否为本域或外域(主要归档本地->本地、本地->外地、外地->本地),然后将此邮件存储至邮件归档服务器,并在发送过程中增加信头说明。
V.1.2 归档服务器端
归档服务器程序在归档队列中扫描到邮件后,解析邮件信头 X-eYou-Backup: 字段,确定发件人和收件人本地或外地属性,对于发件人为本地的邮件,将邮件保存到发件人的Sent邮箱,对于收件人为本地的邮件,将邮件保存到收件人的Inbox邮箱。在这个过程中,可以根据备份服务器配置,进行自动创建域和用户,为了安全起见,创建用户期间有系统生成随机密码。
V.1.3 搜索引擎
邮件归档能够将系统中每一个用户收到和发出的邮件均统一分类存储,就决定了邮件归档的数据量将是邮件系统数据量的几十倍甚至几百倍。因为邮箱空间将要消耗殆尽前,用户总是会清理一批没有用处的信件。因此,邮件系统的数据是动态变化的。但是,归档的数据却是实时更新,而永远没有用户去维护空间需求。如果不对这些信件索引和排序,任何一个普通用户要找到一封信就如同大海捞针,工作量非常大。更别说管理员针对全域内的所有用户邮箱也需要查找一封包含某关键词的信件。其难度可想而知。
功能模块设计图示中的搜索引擎部分就是做这个工作的。
V.1.4 支持附件内容搜索
邮件归档系统检索功能不仅支持信头关键字,如主题、收件人、发件人、信件正文等的检索,还支持常见的附件内容搜索,比如Office全系列文档、PDF、ZIP等各种附件格式。最大程度的方便用户的搜索行为。
在Unix中涉及到多种文档格式的转换,如.doc .pdf .ppt .xls .csv .txt .htm .html .rar .zip等等。为了实现用户能够对记忆中的附件内容片段进行搜索,就有必要在归档产品中整合附件内容剥离技术。
V.1.5 索引合并
在归档系统中,搜索引擎所依赖的所谓分为:
1、 主索引
2、 增量索引
主索引是某个季度的索引主体。一般情况下大于增量索引。用于提供“实时”用户查询。
增量索引与主索引相似但用途不同。可以设置为系统每天22点自动将一天来收到的增量部分邮件进行一次增量索引。并合并到之前的主索引当中去供用户搜索。
V.2 邮件归档自动域名、用户管理
邮件归档产品作为邮件产品的有益补充,是邮件产品的技术延续,在解决了其大量信件的存储以及大规模数据索引和搜索等技术问题后,也给管理员带来了管理的难题。比如员工的入职、离职、转岗等一系列事件,需要管理员配合人事部门进行相关电子系统的开户、销户、锁定等操作。
邮件归档产品为了减轻管理员的日常维护操作,采取了自动化的开通域名和开通用户账号的技术实现。该技术实现的理论依据是:
只有在邮件系统成功投递或者接受的信件才会由邮件系统核心送达邮件归档产品。因此,凡是投递到邮件归档产品的信件的域名以及收件人或者发件人肯定是合法的域名或者合法用户。因此,邮件归档产品对于本地不存在的邮件域名或者用户会自动创建。并生成随机密码。
V.3 系统随机密码,那么普通用户如何申请查看归档?
根据系统规则,在某种条件下用户可以查看其被归档的邮箱,比如需要找回一封误删的重要邮件。
申请查看归档需求告知管理员,当管理员同意了这个申请,该普通用户能够收到信件,内含归档系统的临时随机密码。该密码在一定期限内有效。流程图如下所示:
.jpg)
(责任编辑:李慧芳)