一种船舶邮件解析方法、装置、电子设备及存储介质与流程
未命名
08-03
阅读:90
评论:0

1.本技术涉及电子邮件的技术领域,尤其是涉及一种船舶邮件解析方法、装置、电子设备及存储介质。
背景技术:
2.电子邮件是一种用电子手段提供信息交换的通信方式,是互联网应用最广的服务。通过网络的电子邮件系统,用户可以以非常低廉的价格、非常快速的方式,与世界上任何一个角落的网络用户联系。随着互联网技术的快速发展,邮件往来已成为个人交流和企业办公的过程中不可或缺的沟通方式,电子邮件的存在极大地方便了人与人之间的沟通与交流,促进了社会的发展。
3.在航运领域,邮件的应用同样普遍,对于航运公司,在接收到邮件后,需要对邮件进行分析与处理,将有用的信息进行整理并存储起来,有用的信息例如船舶名称,船舶停靠港口,货物类型以及货物重量等信息。但是,现阶段对邮件进行分析与处理的工作多由工作人员手动操作,并利用人工对邮件内容进行分析,造成人力资源的浪费,同时人工查看并分析邮件时的效率较低。
技术实现要素:
4.为了减小船舶邮件解析时的人力资源的浪费,本技术提供一种船舶邮件解析方法、装置、电子设备及存储介质。
5.第一方面,本技术提供一种船舶邮件解析方法,采用如下的技术方案:一种船舶邮件解析方法,包括:获取待处理邮件;将所述待处理邮件的正文进行划分,得到至少一个待解析数据块;根据每个待解析数据块的数据,确定所述每个待解析数据块对应的数据类型,所述数据类型为待解析数据块中的数据的类型;当待解析数据块对应的数据类型存在盘类型时,解析所述待解析数据块,以确定所述待解析数据块中的盘类型数据,并将所述盘类型数据进行存储,其中,所述盘类型数据为类型属于盘类型的数据,所述盘类型包括船盘类型、货盘类型以及期租盘类型。
6.通过采用上述技术方案,获取待处理邮件之后,划分待处理邮件的正文,得到至少一个待解析数据块,确定每个待解析数据块对应的数据类型,解析各个数据类型为盘类型的待解析数据块,得到盘类型数据并且将盘类型数据进行存储;从而实现了船舶邮件的自动解析,无需工作人员手动操作,减小了人力资源的浪费,同时也有助于改善工作人员疲劳时产生的解析邮件效率低的问题,从而有助于提高解析船舶邮件时的效率。
7.在一种可能的实现方式中,所述将所述待处理邮件的正文进行划分,得到至少一个待解析数据块,包括:基于所述待处理邮件的正文中的空行,对所述待处理邮件的正文进行划分,得到
至少一个初始数据块;识别每个初始数据块中是否存在预设关键字,所述预设关键字为预先设定的字符,所述预设关键字用于指示划分船舶邮件的正文;根据每个初始数据块的识别结果,对所述待处理邮件对应的初始数据块进行处理,以得到待解析数据块。
8.通过采用上述技术方案,预设关键字代表了船舶邮件中的信息,根据船舶邮件的正文中的空行以及船舶邮件中的信息,将待处理邮件的正文进行划分,之后识别划分后得到的各个待解析数据块中的数据,以将待处理邮件的正文进行分块后再进行解析,各个待解析数据块中的数据的数量少于待处理邮件的正文,因此在解析时相较将整个正文一次性解析,采用分块解析的方式更不易遗漏待解析数据块中的有用的数据,以使得解析出的数据更全面,有利于减少解析时将有用信息遗漏的几率;同时在划分时,根据船舶邮件中的预设关键字以及空行对船舶邮件进行划分,使得划分时更合理,便于后续处理。
9.在另一种可能的实现方式中,所述根据每个初始数据块的识别结果,对所述待处理邮件对应的初始数据块进行处理,以得到待解析数据块,包括:根据每个初始数据块的识别结果,确定第一初始数据块,所述第一初始数据块为识别结果中包括所述预设关键字的初始数据块;基于每个第一初始数据块所包括的预设关键字,对所述第一初始数据块进行处理,得到第二初始数据块;根据所述第二初始数据块以及识别结果为空集的初始数据块,确定待解析数据块。
10.通过采用上述技术方案,将存在预设关键字的初始数据块作为第一初始数据块,根据预设关键字所代表意义的不同将第一初始数据块进行不同的处理得到第二初始数据块,将处理好的第二初始数据块以及不存在预设关键字的初始数据块作为待解析数据块,即得到的各个待解析数据块组成待处理邮件的正文,以提供一种根据预设关键字的识别结果确定待解析数据块的实现方式,同时使得待处理邮件正文的划分更加合理,便于后续处理。
11.在另一种可能的实现方式中,所述预设关键字包括第一预设关键字以及第二预设关键字,所述第一预设关键字为船舶邮件中分盘对应的标准字符,所述第二预设关键字为船舶邮件中用于指示信息的标准字符;其中,所述基于每个第一初始数据块所包括的预设关键字,对所述第一初始数据块进行处理,得到第二初始数据块,包括:将包括第一预设关键字的第一初始数据块,按照所述第一预设关键字的位置进行拆分,以得到拆分后的第一初始数据块;针对包括第二预设关键字的第一初始数据块,根据所述包括第二预设关键字的第一初始数据块对应的第二预设关键字,从所述包括第二预设关键字的第一初始数据块的数据中,查找每个所述包括第二预设关键字的第一初始数据块对应的实际数据;根据每个所述包括第二预设关键字的第一初始数据块对应的实际数据,将实际数据相同的第一初始数据块进行合并,得到合并后的第一初始数据块;根据所述合并后的第一初始数据块、所述拆分后的第一初始数据块以及剩余的第
一初始数据块,确定第二初始数据块,所述剩余的第一初始数据块为不包括第一预设关键字,且,包括第二预设关键字,且,不存在与第二预设关键字对应的实际数据相同的第一初始数据块。
12.通过采用上述技术方案,对于包括第一预设关键字的第一初始数据块,在第一预设关键字的位置处将第一初始数据块进行拆分;对于包括第二预设关键字的第一初始数据块,根据第一初始数据块对应的实际数据,将实际数据相同的第一初始数据块进行合并,以便于将同一条船的数据合并为一个数据块,从而将同一条船的数据一并解析出来并存储;同时将预设关键字分为第一预设关键字和第二预设关键字,更容易判断第一初始数据块需要进行拆分操作还是合并操作,更加方便了待处理邮件正文的划分过程。
13.在另一种可能的实现方式中,所述识别每个初始数据块中是否存在预设关键字,包括:根据每个初始数据块中的数据,判断所述每个初始数据块的数据中是否存在与预设关键字相似的字符;若存在,则将所述每个初始数据块中与预设关键字相似的字符替换为对应的预设关键字,得到替换后的初始数据块,并识别所述替换后的初始数据块中是否存在预设关键字。
14.通过采用上述技术方案,在识别每个初始数据块中的预设关键字时,将初始数据块中与预设关键字相似的字符替换为对应的预设关键字,以得到替换后的初始数据块,之后再识别每个替换后的初始数据块中的预设关键字,从而减小了与预设关键字表征相同意义的字符由于表述不同导致无法识别的可能性,从而使待处理邮件正文的划分更加准确。
15.在另一种可能的实现方式中,所述当待解析数据块对应的数据类型存在盘类型时,解析所述待解析数据块,以确定所述待解析数据块中的盘类型数据,包括:当待解析数据块对应的数据类型中存在一个盘类型时,根据所述盘类型,确定所述待解析数据块对应的解析模型;将所述待解析数据块输入至对应的解析模型中进行解析,得到所述待解析数据块中的盘类型数据。
16.通过采用上述技术方案,识别待解析数据块对应的盘类型,若待解析数据块对应的数据类型中只存在一个盘类型,则将每个待解析数据块输入至对应的解析模型中进行解析,对应的解析模型是针对一种盘类型的待解析数据块进行解析的模型,有利于提高解析邮件时的解析正确率。
17.在另一种可能的实现方式中,所述当待解析数据块对应的数据类型存在盘类型时,解析所述待解析数据块,以确定所述待解析数据块中的盘类型数据,包括:当待解析数据块对应的数据类型存在至少两种盘类型时,将所述待解析数据块进行划分,得到待解析数据子块,每个所述待解析数据子块对应一个盘类型,待解析数据子块的数量等于待解析数据对应的盘类型的数量;根据每个待解析数据子块对应的盘类型,确定每个待解析数据子块对应的解析模型;将每个待解析数据子块输入至对应的解析模型进行解析,得到每个待解析数据子块对应的盘类型数据。
18.通过采用上述技术方案,当待解析数据块对应的数据类型存在至少两种盘类型时,需要将待解析数据块再次进行划分,得到待解析数据子块,直至每个待解析数据子块对应一个盘类型,再将待解析数据子块输入对应的解析模型中进行解析,有利于提高解析数据时的正确率。
19.在另一种可能的实现方式中,所述将所述待处理邮件的正文进行划分,得到至少一个待解析数据块,之前还包括:根据待处理邮件的标题,判断待处理邮件是否为船舶邮件;其中,所述将所述待处理邮件的正文进行划分,得到至少一个待解析数据块,包括:若所述待处理邮件为船舶邮件,则将所述待处理邮件的正文进行划分,得到至少一个待解析数据块。
20.通过采用上述技术方案,在将待处理邮件进行划分之前,先判断待处理邮件是否为船舶邮件,若待处理邮件为船舶邮件,则对待处理邮件进行处理,若待处理邮件不为船舶邮件,则不进行处理,仅对船舶邮件进行处理,提高了船舶邮件的处理效率。
21.第二方面,本技术提供一种船舶邮件解析装置,采用如下的技术方案:一种船舶邮件解析装置,包括:邮件获取模块,用于获取待处理邮件;邮件划分模块,用于将所述待处理邮件的正文进行划分,得到至少一个待解析数据块;类型确定模块,用于根据每个待解析数据块的数据,确定所述每个待解析数据块对应的数据类型,所述数据类型为待解析数据块中的数据的类型;数据解析模块,用于当待解析数据块对应的数据类型存在盘类型时,解析所述待解析数据块,以确定所述待解析数据块中的盘类型数据,并将所述盘类型数据进行存储,其中,所述盘类型数据为类型属于盘类型的数据,所述盘类型包括船盘类型、货盘类型以及期租盘类型。
22.通过采用上述技术方案,通过邮件获取模块获取待处理邮件,通过邮件划分模块划分待处理邮件的正文,得到至少一个待解析数据块,通过类型确定模块确定每个待解析数据块对应的数据类型,通过数据解析模块解析各个数据类型为盘类型的待解析数据块,得到盘类型数据并且将盘类型数据进行存储;从而实现了船舶邮件的自动解析,无需工作人员手动操作,减小了人力资源的浪费,同时也有助于改善工作人员疲劳时产生的解析邮件效率低的问题,从而有助于提高解析船舶邮件时的效率。
23.在一种可能的实现方式中,所述邮件划分模块在将所述待处理邮件的正文进行划分,得到至少一个待解析数据块时,具体用于:基于所述待处理邮件的正文中的空行,对所述待处理邮件的正文进行划分,得到至少一个初始数据块;识别每个初始数据块中是否存在预设关键字,所述预设关键字为预先设定的字符,所述预设关键字用于指示划分船舶邮件的正文;根据每个初始数据块的识别结果,对所述待处理邮件对应的初始数据块进行处理,以得到待解析数据块。
24.在另一种可能的实现方式中,所述邮件划分模块在根据每个初始数据块的识别结果,对所述待处理邮件对应的初始数据块进行处理,以得到待解析数据块时,具体用于:根据每个初始数据块的识别结果,确定第一初始数据块,所述第一初始数据块为识别结果中包括所述预设关键字的初始数据块;基于每个第一初始数据块所包括的预设关键字,对所述第一初始数据块进行处理,得到第二初始数据块;根据所述第二初始数据块以及识别结果为空集的初始数据块,确定待解析数据块。
25.在另一种可能的实现方式中,所述预设关键字包括第一预设关键字以及第二预设关键字,所述第一预设关键字为船舶邮件中分盘对应的标准字符,所述第二预设关键字为船舶邮件中用于指示信息的标准字符;其中,所述邮件划分模块在基于每个第一初始数据块所包括的预设关键字,对所述第一初始数据块进行处理,得到第二初始数据块时,具体用于:将包括第一预设关键字的第一初始数据块,按照所述第一预设关键字的位置进行拆分,以得到拆分后的第一初始数据块;针对包括第二预设关键字的第一初始数据块,根据所述包括第二预设关键字的第一初始数据块对应的第二预设关键字,从所述包括第二预设关键字的第一初始数据块的数据中,查找每个所述包括第二预设关键字的第一初始数据块对应的实际数据;根据每个所述包括第二预设关键字的第一初始数据块对应的实际数据,将实际数据相同的第一初始数据块进行合并,得到合并后的第一初始数据块;根据所述合并后的第一初始数据块、所述拆分后的第一初始数据块以及剩余的第一初始数据块,确定第二初始数据块,所述剩余的第一初始数据块为不包括第一预设关键字,且,包括第二预设关键字,且,不存在与第二预设关键字对应的实际数据相同的第一初始数据块。
26.在另一种可能的实现方式中,所述邮件划分模块在识别每个初始数据块中是否存在预设关键字时,具体用于:根据每个初始数据块中的数据,判断所述每个初始数据块的数据中是否存在与预设关键字相似的字符;若存在,则将所述每个初始数据块中与预设关键字相似的字符替换为对应的预设关键字,得到替换后的初始数据块,并识别所述替换后的初始数据块中是否存在预设关键字。
27.在另一种可能的实现方式中,所述数据解析模块在当待解析数据块对应的数据类型存在盘类型时,解析所述待解析数据块,以确定所述待解析数据块中的盘类型数据时,具体用于:当待解析数据块对应的数据类型中存在一个盘类型时,根据所述盘类型,确定所述待解析数据块对应的解析模型;将所述待解析数据块输入至对应的解析模型中进行解析,得到所述待解析数据块中的盘类型数据。
28.在另一种可能的实现方式中,所述数据解析模块在当待解析数据块对应的数据类
型存在盘类型时,解析所述待解析数据块,以确定所述待解析数据块中的盘类型数据时,具体用于:当待解析数据块对应的数据类型存在至少两种盘类型时,将所述待解析数据块进行划分,得到待解析数据子块,每个所述待解析数据子块对应一个盘类型,待解析数据子块的数量等于待解析数据对应的盘类型的数量;根据每个待解析数据子块对应的盘类型,确定每个待解析数据子块对应的解析模型;将每个待解析数据子块输入至对应的解析模型进行解析,得到每个待解析数据子块对应的盘类型数据。
29.在另一种可能的实现方式中,所述装置还包括:判断模块,用于根据待处理邮件的标题,判断待处理邮件是否为船舶邮件;其中,所述邮件划分模块在将所述待处理邮件的正文进行划分,得到至少一个待解析数据块时,具体用于:若所述待处理邮件为船舶邮件,则将所述待处理邮件的正文进行划分,得到至少一个待解析数据块。
30.第三方面,本技术提供一种电子设备,采用如下的技术方案:一种电子设备,该电子设备包括:至少一个处理器;存储器;至少一个应用程序,其中至少一个应用程序被存储在存储器中并被配置为由至少一个处理器执行,所述至少一个应用程序配置用于:执行上述船舶邮件解析方法。
31.第四方面,本技术提供一种计算机可读存储介质,采用如下的技术方案:一种计算机可读存储介质,包括:存储有能够被处理器加载并执行上述船舶邮件解析方法的计算机程序。
32.综上所述,本技术至少包括以下有益技术效果:1、获取待处理邮件之后,划分待处理邮件的正文,得到至少一个待解析数据块,确定每个待解析数据块对应的数据类型,解析各个数据类型为盘类型的待解析数据块,得到盘类型数据并且将盘类型数据进行存储;从而实现了船舶邮件的自动解析,无需工作人员手动操作,减小了人力资源的浪费,同时也有助于改善工作人员疲劳时产生的解析邮件效率低的问题,从而有助于提高解析船舶邮件时的效率;2、预设关键字代表了船舶邮件中的信息,根据船舶邮件的正文中的空行以及船舶邮件中的信息,将待处理邮件的正文进行划分,之后识别划分后得到的各个待解析数据块中的数据,以将待处理邮件的正文进行分块后再进行解析,各个待解析数据块中的数据的数量少于待处理邮件的正文,因此在解析时相较将整个正文一次性解析,采用分块解析的方式更不易遗漏待解析数据块中的有用的数据,以使得解析出的数据更全面,有利于减少解析时将有用信息遗漏的几率;同时在划分时,根据船舶邮件中的预设关键字以及空行对船舶邮件进行划分,使得划分时更合理,便于后续处理;3、识别待解析数据块对应的盘类型,若待解析数据块对应的数据类型中只存在一个盘类型,则将每个待解析数据块输入至对应的解析模型中进行解析,对应的解析模型是
针对一种盘类型的待解析数据块进行解析的模型,有利于提高解析邮件时的解析正确率。
附图说明
33.图1是本技术实施例一种船舶邮件解析方法的流程示意图;图2是本技术实施例待处理邮件划分的流程示意图;图3是本技术实施例预设关键字识别的流程示意图;图4是本技术实施例初始数据块处理的流程示意图;图5是本技术实施例第一初始数据块处理的流程示意图;图6是本技术实施例单盘类型的待解析数据块解析的流程示意图;图7是本技术实施例多盘类型的待解析数据块解析的流程示意图;图8是本技术实施例一种船舶邮件解析装置的方框示意图;图9是本技术实施例电子设备的示意图。
实施方式
34.以下结合附图1-9对本技术作进一步详细说明。
35.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
36.船舶邮件指航运领域用于传送关于船舶、货物以及船舶租赁信息的电子邮件,主要包括船盘类型、货盘类型、期租盘类型以及船舶规范类型的邮件。
37.接收到船舶邮件,工作人员需要对船舶邮件进行分析与处理,筛选出船舶邮件中有用的信息,并且将有用的信息进行整理并存储起来,有用的信息例如船舶名称,船舶停靠港口,货物类型以及货物重量等信息。
38.为了自动对船舶邮件进行解析,本技术实施例提供了一种船舶邮件解析方法,由电子设备执行,其中,参照图1,该方法包括:步骤s101、获取待处理邮件。
39.具体地,待处理邮件指邮箱中未进行处理的邮件。
40.获取待处理邮件的方式具体可以包括:当检测到接收到新邮件时获取;还可以包括每隔预设时长获取;还可以包括当接收到第一预设数量的邮件时进行获取。
41.更具体地,获取待处理邮件具体可以从邮箱中获取,邮箱内存储有接收到的各个邮件,可以直接从邮箱中获取未进行处理的邮件;还可以从预设的邮件文件夹中获取,在预设的邮件文件夹中存储有第二预设数量的邮件,该第二预设数量的邮件可以是从邮箱中获取到的。
42.步骤s102、将待处理邮件的正文进行划分,得到至少一个待解析数据块。
43.具体地,船舶邮件通常由标题、发件人、收件人以及正文等四部分组成,其中,船舶邮件的正文中包含了船舶相关的信息、货物相关的信息以及租赁相关的信息等与航运公司相关联的信息也即盘类型数据,因此可以从船舶邮件的正文中识别出船舶相关的信息。
44.其中,在邮件的正文中往往不止存在有船舶相关的信息,通常还存在打招呼用语
和致敬语等无关船舶的信息,因此在识别盘类型数据之前,将待处理邮件的正文进行划分,得到至少一个待解析数据块,之后再进行识别与解析。
45.更具体地,划分时可以按照预设行数对待处理邮件进行划分,也即每隔预设行数阈值,将待处理邮件划分为一个待解析数据块,直至剩余的行数不大于预设行数阈值,当剩余的行数不大于预设行数阈值时,剩余的待处理邮件即为一个待解析数据块。例如待处理邮件的正文共包括10行,预设行数阈值为3行,则可以将待处理邮件的正文划分为4个待解析数据块,其中,4个待解析数据块分别包括3行、3行、3行以及1行数据。
46.步骤s103、根据每个待解析数据块的数据,确定每个待解析数据块对应的数据类型。
47.其中,数据类型为待解析数据块中的数据的类型,具体地,数据类型包括:盘类型、打招呼类型以及致敬语类型。其中,盘类型包括:船盘类型、货盘类型以及期租盘类型。更具体地,船盘类型为邮件中用于表征船舶相关信息对应的数据的类型,船舶相关信息具体可以包括船舶名称、船舶停靠地以及船舶停靠时间。例如:数据“mv. maritime fortune open cjk 1
ꢀ‑ꢀ
5 nov”,表征船舶的名称是maritime fortune,船舶停靠地是cjk,船舶停靠时间是1
ꢀ‑ꢀ
5 nov,也即该数据的数据类型为船盘类型。货盘类型为邮件中用于表征货物相关信息对应的数据的类型,船舶相关信息具体可以包括货物名称、货物重量以及货物品类。例如:数据“coal 32 tons”,表征货物名称是coal,货物重量是32 tons,也即该数据的数据类型为货盘类型。期租盘类型为邮件中用于表征船舶租赁相关信息对应的数据的类型,船舶租赁相关信息具体可以包括租赁时间和租赁地,例如:数据“rent 1
ꢀ‑ꢀ
20 jan”,表征租赁时间是rent 1
ꢀ‑ꢀ
20 jan,也即该数据的数据类型为期租盘类型。
48.具体地,待解析数据块对应的数据类型包括待解析数据块中的各个数据对应的数据类型,例如,待解析数据块a为“good day open cjk 1
ꢀ‑ꢀ
5 nov”, 该数据在船舶邮件中表征“今天好 船舶于11月1-5日在长江口开放”,其中,“good day”为打招呼类型的数据,“open cjk 1
ꢀ‑ꢀ
5 nov”为船盘类型的数据,则待解析数据块a对应的数据类型包括打招呼类型以及船盘类型。
49.更具体地,以任意一个待解析数据块为例,说明根据该任意一个待解析数据块中的数据确定该任意一个待解析数据块对应的数据类型的实现方式,具体地,在确定该任意一个待解析数据块对应的数据类型时,具体可以将该任意一个待解析数据块输入至预先训练好的模型中,得到该任意一个待解析数据块对应的数据类型,其中,该模型具体可以是双向循环神经网络模型,还可以是rfm分析模型。
50.其中,该模型是经过大量样本数据预先训练好的,该样本数据具体可以是标注有数据类型的数据块,基于大量的样本数据对模型进行训练,以使得将待解析数据块输入至训练好的模型中,可以得到该待解析数据块对应的数据类型。
51.步骤s104、当待解析数据块对应的数据类型存在盘类型时,解析待解析数据块,以确定待解析数据块中的盘类型数据,并将盘类型数据进行存储。
52.其中,盘类型数据为类型属于盘类型的数据。
53.具体地,当待解析数据块对应的数据类型存在盘类型时,表征该待解析数据块中存在盘类型的数据,即盘类型数据,例如:上述步骤s103示例中的待解析数据块a,对应的数据类型包括船盘类型,且,船盘类型对应的数据为“open cjk 1
ꢀ‑ꢀ
5 nov”,也即表征该待解
析数据块a对应的盘类型数据为“open cjk 1
ꢀ‑ꢀ
5 nov”。
54.将待解析数据块进行解析后,得到待解析数据块中的盘类型数据,可以将该盘类型数据直接存储至预设数据库中。进一步地,可以将盘类型数据根据盘类型分类存储到对应的预设数据库表中。例如:待解析数据块b对应的盘类型数据包括船盘类型数据b1和货盘类型数据b2,可以将船盘类型数据b1存储至预设数据库表1;将货盘类型数据b2存储至预设数据库表2,其中,该预设数据库表1为专用于存储船盘类型数据的数据库表,该预设数据库表2为专用于存储货盘类型数据的数据库表。
55.当待解析数据块对应的数据类型不存在盘类型时,即待解析数据块中不存在表征船舶、货物以及租赁相关信息的数据时,可以不解析该待解析数据块,仅对存在盘类型数据的待解析数据块进行解析。
56.本技术实施例提供了一种船舶邮件解析方法,从预设的邮件文件夹中或者直接从邮箱中获取待处理邮件,将待处理邮件的正文进行划分,得到至少一个待解析数据块,确定待解析数据块对应的数据类型,并且解析数据类型为盘类型的待解析数据块,得到盘类型数据并且根据盘类型分类存储;一种船舶邮件解析方法实现了船舶邮件的自动解析,无需工作人员手动操作,减小了人力资源的浪费,同时提高了邮件的解析效率。
57.本技术实施例一种可能的实现方式,在上述步骤s102中,将待处理邮件的正文进行划分,得到至少一个待解析数据块,具体可以通过步骤s1021、步骤s1022以及步骤s1023实现,参照图2,其中:步骤s1021、基于待处理邮件的正文中的空行,对待处理邮件的正文进行划分,得到至少一个初始数据块。
58.具体地,待处理邮件的正文中的空行即待处理邮件正文中不包含任何字符的一行。
59.待处理邮件的正文中可能存在至少一个空行,也可能不存在空行,当待处理邮件的正文中不存在空行时,将待处理邮件划分后得到一个初始数据块,且该初始数据块即为待处理邮件的正文。
60.当待处理邮件的正文中存在至少一个空行时,从正文的首行开始检测,在每个空行处对待处理邮件的正文进行一次划分,例如:待处理邮件c中包括两个空行,更具体地待处理邮件c包括:“good dayopen cjk 1
ꢀ‑ꢀ
5 novmv. maritime fortune”则,该待处理邮件c划分后得到的初始数据块包括初始数据块c1“good day”,初始数据块c2“open cjk 1
ꢀ‑ꢀ
5 nov”以及初始数据块c3“mv. maritime fortune”。
61.进一步地,当待处理邮件的正文中连续出现至少两个空行时,删除重复的空行,也即将重复出现的至少两个空行对应更新为一个空行,之后再基于空行的位置对待处理邮件进行划分。例如:待处理邮件d包括:“good dayopen cjk 1
ꢀ‑ꢀ
5 nov”则,该待处理邮件d划分后得到的初始数据块包括初始数据块d1“good day”以及
初始数据块d2“open cjk 1
ꢀ‑ꢀ
5 nov”。
62.步骤s1022、识别每个初始数据块中是否存在预设关键字。
63.其中,预设关键字为预先设定的字符,用于指示划分船舶邮件的正文。具体地,该预设关键字可以为从各个标准字符中确定出来的字符。
64.其中,船舶邮件的撰写通常符合行业的撰写规范,因此,在船舶邮件的撰写规范中设置有标准字符,每个标准字符用于指示对应的信息。其中,一部分标准字符用于指示邮件中内容发生变化,例如:标准字符“/”,表征“/”字符之前的数据与之后的数据的意义不同。另一部分标准字符用于指示该部分标准字符对应的数据的意义。例如,标准字符“mv”,用于指示该标准字符对应的数据的意义为船舶名称,当船舶邮件中出现该标准字符“mv”时,表征在标准字符“mv”所在的行且位于标准字符“mv”之后的数据为船舶名称数据;更具体地,船舶邮件中出现“mv maritime fortune”语句,表征“maritime fortune”为船舶名称数据。
65.也即,标准字符表征了船舶邮件中各部分数据之间是否存在联系,或者船舶邮件中各个数据的含义。因此,可以根据船舶邮件中所出现的各个标准字符,将船舶邮件的正文进行划分。
66.更具体地,预设关键字包括用于指示邮件中内容发生变化的标准字符,例如“+”、
“‑”
_、“、”“fresh”以及“direct”,当出现该类标准字符时,可以将该类标准字符前的数据划分为一个数据块,将该类标准字符后的数据划分为一个数据块。
67.预设关键字还可以包括用于指示对应的数据的意义为预设意义的标准字符,该预设意义具体可以包括船舶名称,还可以包括货物编号,在本技术实施例中不做限定。对于同一条船,或者同一批货物,在划分时可以将一条船的数据划分为一个数据块,将同一批货物的数据划分为一个数据块。
68.因此,识别每个初始数据块中是否存在预设关键字,以便于根据初始数据块中的预设关键字继续对各个初始数据块进行处理。
69.本技术实施例一种可能的实现方式,在上述步骤s1022中,识别每个初始数据块中是否存在预设关键字,具体可以通过步骤sa1以及步骤sa2实现,参照图3,其中:步骤sa1、根据每个初始数据块中的数据,判断每个初始数据块的数据中是否存在与预设关键字相似的字符。
70.具体地,在撰写船舶邮件时,邮件撰写人员由于个人习惯对同一预设关键字会有不同表述,例如,会将预设关键字“mv”表述为“m.v”、“m.v.”、“m/v”以及“mv.”,所以在识别每个初始数据块中是否存在预设关键字时,也需要判断初始数据块中是否存在与预设关键字相似的字符,通过相似数据检测算法判断初始数据块中是否存在与预设关键字相似的字符。其中,相似数据检测算法可以为shingling算法,也可以为simhash算法。
71.步骤sa2、若存在,则将每个初始数据块中与预设关键字相似的字符替换为对应的预设关键字,得到替换后的初始数据块,并识别替换后的初始数据块中是否存在预设关键字。
72.具体地,若初始数据块中存在与预设关键字相似的字符,则需要先将与预设关键字相似的字符替换为对应的预设关键字,再对替换后的初始数据块进行识别。
73.对于本技术实施例,在识别每个初始数据块中的预设关键字时,将初始数据块中与预设关键字相似的字符替换为对应的预设关键字,以得到替换后的初始数据块,之后再
识别每个替换后的初始数据块中的预设关键字,从而减小了与预设关键字表征相同意义的字符由于表述不同导致无法识别的可能性,从而使待处理邮件正文的划分更加准确。
74.步骤s1023、根据每个初始数据块的识别结果,对待处理邮件对应的初始数据块进行处理,以得到待解析数据块。
75.具体地,当初始数据块中不存在预设关键字时,对应的识别结果为空集,该初始数据块即为待解析数据块;当初始数据块中存在预设关键字时,对应的识别结果包括该初始数据块中存在的预设关键字,根据每个初始数据块中包括的预设关键字,对各个初始数据块进行处理,得到待解析数据块。
76.对于本技术实施例,预设关键字代表了船舶邮件中的信息,根据船舶邮件的正文中的空行以及船舶邮件中的信息,将待处理邮件的正文进行划分,之后识别划分后得到的各个待解析数据块中的数据,以将待处理邮件的正文进行分块后再进行解析,各个待解析数据块中的数据的数量少于待处理邮件的正文,因此在解析时相较将整个正文一次性解析,采用分块解析的方式更不易遗漏待解析数据块中的有用的数据,以使得解析出的数据更全面,有利于减少解析时将有用信息遗漏的几率;同时在划分时,根据船舶邮件中的预设关键字以及空行对船舶邮件进行划分,使得划分时更合理,便于后续处理。
77.本技术实施例一种可能的实现方式,在上述步骤s1023中,根据每个初始数据块的识别结果,对待处理邮件对应的初始数据块进行处理,以得到待解析数据块,具体可以通过步骤sb1、步骤sb2以及步骤sb3实现,参照图4,其中:步骤sb1、根据每个初始数据块的识别结果,确定第一初始数据块。其中,第一初始数据块为识别结果中包括预设关键字的初始数据块。
78.具体地,识别结果包括空集和初始数据块中存在的预设关键字,将识别结果包括预设关键字的初始数据块作为第一初始数据块。
79.步骤sb2、基于每个第一初始数据块所包括的预设关键字,对第一初始数据块进行处理,得到第二初始数据块。
80.具体地,根据预设关键字所代表意义的不同将第一初始数据块进行合并或者拆分,将合并或者拆分后的第一初始数据块作为第二初始数据块。
81.步骤sb3、根据第二初始数据块以及识别结果为空集的初始数据块,确定待解析数据块。
82.具体地,将初始数据块中存在预设关键字的数据块作为第一初始数据块,之后,可以根据预设关键字所代表意义的不同将各个第一初始数据块进行合并或者拆分,将合并或者拆分后的第一初始数据块作为第二初始数据块。之后将第二初始数据块和识别结果为空集的初始数据块确定为待解析数据块,其中,识别结果为空集的初始数据块即为不存在预设关键字的初始数据块。
83.对于本技术实施例,将存在预设关键字的初始数据块作为第一初始数据块,根据预设关键字所代表意义的不同将第一初始数据块进行不同的处理得到第二初始数据块,将处理好的第二初始数据块以及不存在预设关键字的初始数据块作为待解析数据块,即得到的各个待解析数据块组成待处理邮件的正文,以提供一种根据预设关键字的识别结果确定待解析数据块的实现方式,同时使得待处理邮件正文的划分更加合理,便于后续处理。
84.本技术实施例一种可能的实现方式,预设关键字包括第一预设关键字和第二预设
关键字,第一预设关键字为船舶邮件中分盘对应的标准字符,在船舶邮件中,“+”、
“‑”
、“_”、“fresh”以及“direct”等标准字符用于表征前后为不同数据类型的数据,需要进行分盘,也即第一预设关键字包括“+”、
“‑”
、“_”、“fresh”以及“direct”。第二预设关键字为船舶邮件中用于指示船舶信息的标准字符,例如:“mv”。
85.具体地,在上述步骤sb2中,基于每个第一初始数据块所包括的预设关键字,对第一初始数据块进行处理,得到第二初始数据块,具体可以通过步骤sb21、步骤sb22、步骤sb23以及步骤sb24实现,参照图5,其中:步骤sb21、将包括第一预设关键字的第一初始数据块,按照第一预设关键字的位置进行拆分,以得到拆分后的第一初始数据块。
86.具体地,当初始数据块中出现任意一个该第一预设关键字所对应的标准字符时,表征该初始数据块包括至少两种不同数据类型的数据,因此可以在出现第一预设关键字的位置处进行分块,从而可以尽量使得每个数据块均为单一类型的数据块,也即使得每个初始数据块中的数据类型为一个。例如:当第一初始数据块中出现预设关键字“fresh”时,将第一初始数据块按照“fresh”所在的位置,进行拆分,也即将位于“fresh”之前的数据拆分为一个数据块,将“fresh”之后的数据拆分为一个数据块,得到两个拆分后的第一初始数据块。
87.步骤sb22、针对包括第二预设关键字的第一初始数据块,根据包括第二预设关键字的第一初始数据块对应的第二预设关键字,从包括第二预设关键字的第一初始数据块的数据中,查找每个包括第二预设关键字的第一初始数据块对应的实际数据。
88.具体地,对于具备相同船舶名称或者相同的货物编号的两个第一初始数据块,表征该两个第一初始数据块为关于同一条船或者同一批货物的数据,因此可以将两个第一初始数据块合并为一个初始数据块,以对合并后的第一初始数据块进行解析,以便于一次性将同一条船或者同一批货物的数据解析出来,而不至于分开解析,以降低解析速率。
89.更具体地,为了确定出具备相同船名或者相同货物编号的第一初始数据块,在本技术实施例中,当第一初始数据块中存在第二预设关键字时,表征该第一初始数据块中存在船舶名称的相关信息或者存在货物编号的相关信息,因此,可以从该第一初始数据块中,查找到该第一初始数据块所对应的船舶名称或者货物编号,其中,查找到的船舶名称或者货物编号,即为该第一初始数据块对应的实际数据。例如:第一初始数据块x1中包括第二预设关键字“mv”,第二预设关键字“mv”为表征船舶邮件中船舶名称的标准字符,当船舶邮件中出现预设关键字“mv”时,在第二预设关键字“mv”之后会出现具体地船舶名称,例如船舶名称“maritime fortune”,也即该第一初始数据块x1对应的实际数据为“maritime fortune”。
90.确定出每个包括第二预设关键字的第一初始数据块对应的实际数据之后,可以将具备相同船舶名称的第一初始数据块进行合并,或者,将具备相同货物编号的第一初始数据块进行合并。
91.步骤sb23、根据每个包括第二预设关键字的第一初始数据块对应的实际数据,将实际数据相同的第一初始数据块进行合并,得到合并后的第一初始数据块。
92.具体地,例如,第一初始数据块x1对应的实际数据为“maritime fortune”,第一初始数据块x2对应的实际数据也为“maritime fortune”,则将第一初始数据块x1与第一初始
数据块x2进行合并,得到合并后的第一初始数据块。
93.步骤sb24、根据合并后的第一初始数据块、拆分后的第一初始数据块以及剩余的第一初始数据块,确定第二初始数据块,剩余的第一初始数据块为不包括第一预设关键字,且,包括第二预设关键字,且,不存在与第二预设关键字对应的实际数据相同的第一初始数据块。
94.其中,剩余的第一初始数据块为不包括第一预设关键字,且,包括第二预设关键字,且,不存在与第二预设关键字对应的实际数据相同的第一初始数据块。例如:第一初始数据块x3中仅包括第二预设关键字mv,且对应的实际数据为“hai jing”,且,其他的第一初始数据块对应的实际数据均不为“hai jing”,也即第一初始数据块x3既未被拆分,也未被合并,也即该第一初始数据块x3为剩余的第一初始数据块。
95.具体地,将合并后的第一初始数据块、拆分后的第一初始数据块以及剩余的第一初始数据块作为第二初始数据块。
96.进一步地,若第一初始数据块既包括第一预设关键字也包括第二预设关键字,按照第一预设关键字的位置该第一初始数据块进行拆分,以得到拆分后的第一初始数据块,对于拆分后并且包括第二预设关键字的第一初始数据块,根据该第一初始数据块对应的第二预设关键字,从包括第二预设关键字的第一初始数据块的数据中,查找每个包括第二预设关键字的第一初始数据块对应的实际数据,根据每个包括第二预设关键字的第一初始数据块对应的实际数据,将实际数据相同的第一初始数据块进行合并,得到合并后的第一初始数据块,将合并后的第一初始数据块、拆分后的第一初始数据块确定为第二初始数据块。具体的划分方式、查找方式以及合并方式可以参考上述步骤sa21、步骤sa22以及步骤sa23部分的实施例,在此不再赘述。
97.针对本技术实施例,对于包括第一预设关键字的第一初始数据块,在第一预设关键字的位置处将第一初始数据块进行拆分;对于包括第二预设关键字的第一初始数据块,根据第一初始数据块对应的实际数据,将实际数据相同的第一初始数据块进行合并,以便于将同一条船的数据合并为一个数据块,从而将同一条船的数据一并解析出来并存储;同时将预设关键字分为第一预设关键字和第二预设关键字,更容易判断第一初始数据块需要进行拆分操作还是合并操作,更加方便了待处理邮件正文的划分过程。
98.本技术实施例一种可能的实现方式,在上述步骤s104中,当待解析数据块对应的数据类型存在盘类型时,解析待解析数据块,以确定待解析数据块中的盘类型数据,具体可以通过步骤s1041以及步骤s1042实现,参照图6,其中:步骤s1041、当待解析数据块对应的数据类型中存在一个盘类型时,根据盘类型,确定待解析数据块对应的解析模型。
99.具体地,当待解析数据块对应的数据类型中存在一个盘类型时,也即待解析数据块为单盘类型的数据块,可以将每个单盘类型的数据块输入至预先训练好的解析模型中进行数据解析,以得到每个单盘类型的数据块对应的盘类型数据,对于单盘类型的数据块在解析时不容易因为船和货物等的混淆而使得解析出的数据有误,也即可以提高解析的正确率。
100.为了进一步提高解析的正确率,还可以针对不同的盘类型的数据,预先训练不同的盘类型对应的解析模型,例如预先训练船盘类型对应的解析模型、货盘类型对应的解析
模型以及期租盘类型对应的解析模型,每种类型对应的解析模型专用于识别对应类型的数据,例如对于船盘类型对应的解析模型,专用于识别船盘类型的数据。也即,当待解析数据块对应的数据类型中存在一个盘类型时,可以根据该待解析数据块对应的盘类型,确定该盘类型对应的解析模型,以便于采用该盘类型对应的解析模型对待解析数据进行解析。
101.其中,解析模型可以为机器学习crf模型。在训练解析模型时,根据大量标注好的样本数据进行训练,对于船盘类型的解析模型,对应的样本数据为数据仅为船盘类型的数据块,且该数据块中标注有各个船盘类型的数据。对于货盘类型的解析模型,对应的样本数据为数据仅为货盘类型的数据块,且该数据块中标注有各个货盘类型的数据。对于期租盘类型的解析模型,对应的样本数据为数据仅为期租盘类型的数据块,且该数据块中表征有各个期租盘类型的数据。
102.步骤s1042、将待解析数据块输入至对应的解析模型中进行解析,得到待解析数据块中的盘类型数据。
103.具体地,将待解析数据块输入至对应的解析模型中进行解析,解析即将待解析数据块中的盘类型数据提取出来。
104.对于本技术实施例,识别待解析数据块对应的盘类型,若待解析数据块对应的数据类型中只存在一个盘类型,则将每个待解析数据块输入至对应的解析模型中进行解析,对应的解析模型是针对一种盘类型的待解析数据块进行解析的模型,有利于提高解析邮件时的解析正确率。
105.本技术实施例一种可能的实现方式,在上述步骤s104中,当待解析数据块对应的数据类型存在盘类型时,解析待解析数据块,以确定待解析数据块中的盘类型数据,具体还可以通过步骤s1041’、步骤s1042’以及步骤s1043’实现,参照图7,其中:步骤s1041’、当待解析数据块对应的数据类型存在至少两种盘类型时,将待解析数据块进行划分,得到待解析数据子块。
106.其中,每个待解析数据子块对应一个盘类型,待解析数据子块的数量等于待解析数据块对应的盘类型的数量。
107.具体地,在对待处理邮件进行分块时,若邮件的正文内容过于复杂,可能会导致分块不彻底,也即,使得待解析数据块可能存在至少两种盘类型的数据。在对待解析数据块进行解析之前,可以将存在至少两种盘类型的待解析数据块再次进行划分,得到待解析数据子块,具体地划分方式可以参考上述步骤s102部分的实施例,在此不再赘述。
108.在将待解析数据块进行划分,得到待解析数据子块之后,识别每个待解析数据子块对应的数据类型,若待解析数据子块对应的数据类型中仍存在至少两种盘类型,继续划分该待解析数据子块,以及识别划分后的待解析数据子块的数据类型,当划分后的待解析数据子块的数据类型仍存在至少两种时,继续划分,直至划分后的各个待解析数据子块均仅包括一种盘类型,当划分后的待解析数据子块对应的数据类型中存在一个盘类型时,不再继续划分待解析数据子块。
109.步骤s1042’、根据每个待解析数据子块对应的盘类型,确定每个待解析数据子块对应的解析模型。
110.步骤s1043’、将每个待解析数据子块输入至对应的解析模型进行解析,得到每个待解析数据子块对应的盘类型数据。
111.具体地,每个待解析数据子块对应一个盘类型,也即每个待解析数据子块中的数据均属于同一个盘类型,此时可以根据每个待解析数据子块对应的盘类型,确定该盘类型对应的解析模型,并将待解析数据子块输入至对应的解析模型中进行解析,以将待解析数据块中的盘类型数据解析出来。
112.对于本技术实施例,当待解析数据块对应的数据类型存在至少两种盘类型时,需要将待解析数据块再次进行划分,得到待解析数据子块,直至每个待解析数据子块对应一个盘类型,再将待解析数据子块输入对应的解析模型中进行解析,有利于提高解析数据时的正确率。
113.本技术实施例一种可能的实现方式,在上述步骤s102中,将待处理邮件的正文进行划分,得到至少一个待解析数据块,之前还包括:根据待处理邮件的标题,判断待处理邮件是否为船舶邮件。
114.具体地,邮箱接收到的邮件,不仅包括船舶邮件,还包括公司的通知邮件以及广告邮件,公司的通知邮件以及广告邮件均为非船舶邮件,在进行解析时,仅需要对船舶邮件进行解析,而不需要对通知邮件和广告邮件进行解析,因此,在对待处理邮件进行处理之前,可以判断待处理邮件是否为船舶邮件,若为船舶邮件再对待处理邮件进行解析。
115.其中,判断待处理邮件是否为船舶邮件时,具体可以根据待处理邮件的标题进行判断,更具体地,可以对待处理邮件的标题进行语义识别,以判断待处理邮件是否为船舶邮件,还可以识别待处理邮件中是否存在预设船舶字符,该预设船舶字符为预先设定的字符,具体可以包括“mv”、“cargo”以及“tc”,当存在预设船舶字符时,表征该待处理邮件为船舶邮件。
116.此时,在上述步骤s102中,将待处理邮件的正文进行划分,得到至少一个待解析数据块,具体可以包括:若待处理邮件为船舶邮件,则将待处理邮件的正文进行划分,得到至少一个待解析数据块。
117.具体地,在对获取到的待处理邮件进行处理之前,判断待处理邮件是否为船舶邮件,若待处理邮件为船舶邮件,则对待处理邮件的正文进行划分。
118.若待处理邮件不为船舶邮件,则不对该待处理邮件进行处理,并重新获取待处理邮件,也即循环执行上述步骤s101~步骤s104。
119.对于本技术实施例,在将待处理邮件进行划分之前,先判断待处理邮件是否为船舶邮件,若待处理邮件为船舶邮件,则对待处理邮件进行处理,若待处理邮件不为船舶邮件,则不进行处理,仅对船舶邮件进行处理,提高了船舶邮件的处理效率。
120.上述实施例从方法流程的角度介绍一种船舶邮件解析方法,下述实施例从虚拟模块或者虚拟单元的角度介绍了一种船舶邮件解析装置,具体详见下述实施例。
121.参照图8,一种船舶邮件解析装置800,包括:邮件获取模块801,用于获取待处理邮件;邮件划分模块802,用于将待处理邮件的正文进行划分,得到至少一个待解析数据块;类型确定模块803,用于根据每个待解析数据块的数据,确定每个待解析数据块对应的数据类型,数据类型为待解析数据块中的数据的类型;数据解析模块804,用于当待解析数据块对应的数据类型存在盘类型时,解析待解
析数据块,以确定待解析数据块中的盘类型数据,并将盘类型数据进行存储,其中,盘类型数据为类型属于盘类型的数据,盘类型包括船盘类型、货盘类型以及期租盘类型。
122.具体地,通过邮件获取模块801获取待处理邮件,通过邮件划分模块802划分待处理邮件的正文,得到至少一个待解析数据块,通过类型确定模块803确定每个待解析数据块对应的数据类型,通过数据解析模块804解析各个数据类型为盘类型的待解析数据块,得到盘类型数据并且将盘类型数据进行存储;从而实现了船舶邮件的自动解析,无需工作人员手动操作,减小了人力资源的浪费,同时也有助于改善工作人员疲劳时产生的解析邮件效率低的问题,从而有助于提高解析船舶邮件时的效率。
123.本技术实施例一种可能的实现方式中,邮件划分模块802在将待处理邮件的正文进行划分,得到至少一个待解析数据块时,具体用于:基于待处理邮件的正文中的空行,对待处理邮件的正文进行划分,得到至少一个初始数据块;识别每个初始数据块中是否存在预设关键字,预设关键字为预先设定的字符,预设关键字用于指示划分船舶邮件的正文;根据每个初始数据块的识别结果,对待处理邮件对应的初始数据块进行处理,以得到待解析数据块。
124.本技术实施例一种可能的实现方式中,邮件划分模块802在根据每个初始数据块的识别结果,对待处理邮件对应的初始数据块进行处理,以得到待解析数据块时,具体用于:根据每个初始数据块的识别结果,确定第一初始数据块,第一初始数据块为识别结果中包括预设关键字的初始数据块;基于每个第一初始数据块所包括的预设关键字,对第一初始数据块进行处理,得到第二初始数据块;根据第二初始数据块以及识别结果为空集的初始数据块,确定待解析数据块。
125.本技术实施例一种可能的实现方式中,预设关键字包括第一预设关键字以及第二预设关键字,第一预设关键字为船舶邮件中分盘对应的标准字符,第二预设关键字为船舶邮件中用于指示信息的标准字符;邮件划分模块802在基于每个第一初始数据块所包括的预设关键字,对第一初始数据块进行处理,得到第二初始数据块时,具体用于:将包括第一预设关键字的第一初始数据块,按照第一预设关键字的位置进行拆分,以得到拆分后的第一初始数据块;针对包括第二预设关键字的第一初始数据块,根据包括第二预设关键字的第一初始数据块对应的第二预设关键字,从包括第二预设关键字的第一初始数据块的数据中,查找每个包括第二预设关键字的第一初始数据块对应的实际数据;根据每个包括第二预设关键字的第一初始数据块对应的实际数据,将实际数据相同的第一初始数据块进行合并,得到合并后的第一初始数据块;根据合并后的第一初始数据块、拆分后的第一初始数据块以及剩余的第一初始数据块,确定第二初始数据块,剩余的第一初始数据块为不包括第一预设关键字,且,包括第二预设关键字,且,不存在与第二预设关键字对应的实际数据相同的第一初始数据块。
126.本技术实施例一种可能的实现方式中,邮件划分模块802在识别每个初始数据块中是否存在预设关键字时,具体用于:根据每个初始数据块中的数据,判断每个初始数据块的数据中是否存在与预设关键字相似的字符;若存在,则将每个初始数据块中与预设关键字相似的字符替换为对应的预设关键字,得到替换后的初始数据块,并识别替换后的初始数据块中是否存在预设关键字。
127.本技术实施例一种可能的实现方式中,数据解析模块804在当待解析数据块对应的数据类型存在盘类型时,解析待解析数据块,以确定待解析数据块中的盘类型数据时,具体用于:当待解析数据块对应的数据类型中存在一个盘类型时,根据盘类型,确定待解析数据块对应的解析模型;将待解析数据块输入至对应的解析模型中进行解析,得到待解析数据块中的盘类型数据。
128.本技术实施例一种可能的实现方式中,数据解析模块804在当待解析数据块对应的数据类型存在盘类型时,解析待解析数据块,以确定待解析数据块中的盘类型数据时,具体用于:当待解析数据块对应的数据类型存在至少两种盘类型时,将待解析数据块进行划分,得到待解析数据子块,每个待解析数据子块对应一个盘类型,待解析数据子块的数量等于待解析数据对应的盘类型的数量;根据每个待解析数据子块对应的盘类型,确定每个待解析数据子块对应的解析模型;将每个待解析数据子块输入至对应的解析模型进行解析,得到每个待解析数据子块对应的盘类型数据。
129.本技术实施例一种可能的实现方式中,装置800还包括:判断模块,用于根据待处理邮件的标题,判断待处理邮件是否为船舶邮件;其中,邮件划分模块802在将待处理邮件的正文进行划分,得到至少一个待解析数据块时,具体用于:若待处理邮件为船舶邮件,则将待处理邮件的正文进行划分,得到至少一个待解析数据块。
130.所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
131.本技术实施例还从实体装置的角度介绍了一种电子设备,如图9所示,图9所示的电子设备900包括:处理器901和存储器903。其中,处理器901和存储器903相连,如通过总线902相连。可选地,电子设备900还可以包括收发器904。需要说明的是,实际应用中收发器904不限于一个,该电子设备900的结构并不构成对本技术实施例的限定。
132.处理器901可以是cpu(central processing unit,中央处理器),通用处理器,dsp(digital signal processor,数据信号处理器),asic(application specific integrated circuit,专用集成电路),fpga(field programmable gate array,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以
实现或执行结合本技术公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器901也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,dsp和微处理器的组合等。
133.总线902可包括一通路,在上述组件之间传送信息。总线902可以是pci(peripheral component interconnect,外设部件互连标准)总线或eisa(extended industry standard architecture,扩展工业标准结构)总线等。总线902可以分为地址总线、数据总线、控制总线等。为便于表示,图9中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
134.存储器903可以是rom(read only memory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,ram(random access memory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是eeprom(electrically erasable programmable read only memory,电可擦可编程只读存储器)、cd-rom(compact disc read only memory,只读光盘)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
135.存储器903用于存储执行本技术方案的应用程序代码,并由处理器901来控制执行。处理器901用于执行存储器903中存储的应用程序代码,以实现前述方法实施例所示的内容。
136.其中,电子设备包括但不限于:移动电话、笔记本电脑、数字广播接收器、pda(个人数字助理)、pad(平板电脑)、pmp(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字tv、台式计算机等等的固定终端,还可以为服务器等。图9示出的电子设备仅仅是一个示例,不应对本技术实施例的功能和使用范围带来任何限制。
137.本技术实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,当其在计算机上运行时,使得计算机可以执行前述方法实施例中相应内容,在本技术实施例中,获取待处理邮件之后,划分待处理邮件的正文,得到至少一个待解析数据块,确定每个待解析数据块对应的数据类型,解析各个数据类型为盘类型的待解析数据块,得到盘类型数据并且将盘类型数据进行存储;从而实现了船舶邮件的自动解析,无需工作人员手动操作,减小了人力资源的浪费,同时也有助于改善工作人员疲劳时产生的解析邮件效率低的问题,从而有助于提高解析船舶邮件时的效率。
138.应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
139.以上仅是本技术的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本技术原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本技术的保护范围。
技术特征:
1.一种船舶邮件解析方法,其特征在于,所述方法包括:获取待处理邮件;将所述待处理邮件的正文进行划分,得到至少一个待解析数据块;根据每个待解析数据块的数据,确定所述每个待解析数据块对应的数据类型,所述数据类型为待解析数据块中的数据的类型;当待解析数据块对应的数据类型存在盘类型时,解析所述待解析数据块,以确定所述待解析数据块中的盘类型数据,并将所述盘类型数据进行存储,其中,所述盘类型数据为类型属于盘类型的数据,所述盘类型包括船盘类型、货盘类型以及期租盘类型。2.根据权利要求1所述的方法,其特征在于,所述将所述待处理邮件的正文进行划分,得到至少一个待解析数据块,包括:基于所述待处理邮件的正文中的空行,对所述待处理邮件的正文进行划分,得到至少一个初始数据块;识别每个初始数据块中是否存在预设关键字,所述预设关键字为预先设定的字符,所述预设关键字用于指示划分船舶邮件的正文;根据每个初始数据块的识别结果,确定第一初始数据块,所述第一初始数据块为识别结果中包括所述预设关键字的初始数据块;基于每个第一初始数据块所包括的预设关键字,对所述第一初始数据块进行处理,得到第二初始数据块;根据所述第二初始数据块以及识别结果为空集的初始数据块,确定待解析数据块。3.根据权利要求2所述的方法,其特征在于,所述预设关键字包括第一预设关键字以及第二预设关键字,所述第一预设关键字为船舶邮件中分盘对应的标准字符,所述第二预设关键字为船舶邮件中用于指示信息的标准字符;其中,所述基于每个第一初始数据块所包括的预设关键字,对所述第一初始数据块进行处理,得到第二初始数据块,包括:将包括第一预设关键字的第一初始数据块,按照所述第一预设关键字的位置进行拆分,以得到拆分后的第一初始数据块;针对包括第二预设关键字的第一初始数据块,根据所述包括第二预设关键字的第一初始数据块对应的第二预设关键字,从所述包括第二预设关键字的第一初始数据块的数据中,查找每个所述包括第二预设关键字的第一初始数据块对应的实际数据;根据每个所述包括第二预设关键字的第一初始数据块对应的实际数据,将实际数据相同的第一初始数据块进行合并,得到合并后的第一初始数据块;根据所述合并后的第一初始数据块、所述拆分后的第一初始数据块以及剩余的第一初始数据块,确定第二初始数据块,所述剩余的第一初始数据块为不包括第一预设关键字,且,包括第二预设关键字,且,不存在与第二预设关键字对应的实际数据相同的第一初始数据块。4.根据权利要求2所述的方法,其特征在于,所述识别每个初始数据块中是否存在预设关键字,包括:根据每个初始数据块中的数据,判断所述每个初始数据块的数据中是否存在与预设关键字相似的字符;
若存在,则将所述每个初始数据块中与预设关键字相似的字符替换为对应的预设关键字,得到替换后的初始数据块,并识别所述替换后的初始数据块中是否存在预设关键字。5.根据权利要求1所述的方法,其特征在于,所述当待解析数据块对应的数据类型存在盘类型时,解析所述待解析数据块,以确定所述待解析数据块中的盘类型数据,包括:当待解析数据块对应的数据类型中存在一个盘类型时,根据所述盘类型,确定所述待解析数据块对应的解析模型;将所述待解析数据块输入至对应的解析模型中进行解析,得到所述待解析数据块中的盘类型数据。6.根据权利要求1所述的方法,其特征在于,所述当待解析数据块对应的数据类型存在盘类型时,解析所述待解析数据块,以确定所述待解析数据块中的盘类型数据,包括:当待解析数据块对应的数据类型存在至少两种盘类型时,将所述待解析数据块进行划分,得到待解析数据子块,每个所述待解析数据子块对应一个盘类型,待解析数据子块的数量等于待解析数据对应的盘类型的数量;根据每个待解析数据子块对应的盘类型,确定每个待解析数据子块对应的解析模型;将每个待解析数据子块输入至对应的解析模型进行解析,得到每个待解析数据子块对应的盘类型数据。7.根据权利要求1所述的方法,其特征在于,所述将所述待处理邮件的正文进行划分,得到至少一个待解析数据块,之前还包括:根据待处理邮件的标题,判断待处理邮件是否为船舶邮件;其中,所述将所述待处理邮件的正文进行划分,得到至少一个待解析数据块,包括:若所述待处理邮件为船舶邮件,则将所述待处理邮件的正文进行划分,得到至少一个待解析数据块。8.一种船舶邮件解析装置,其特征在于,包括:邮件获取模块,获取待处理邮件;邮件划分模块,将所述待处理邮件的正文进行划分,得到至少一个待解析数据块;类型确定模块,根据每个待解析数据块的数据,确定所述每个待解析数据块对应的数据类型,所述数据类型为待解析数据块中的数据的类型;数据解析模块,当待解析数据块对应的数据类型存在盘类型时,解析所述待解析数据块,以确定所述待解析数据块中的盘类型数据,并将所述盘类型数据进行存储,其中,所述盘类型数据为类型属于盘类型的数据,所述盘类型包括船盘类型、货盘类型以及期租盘类型。9.一种电子设备,其特征在于,该电子设备包括:至少一个处理器;存储器;至少一个应用程序,其中至少一个应用程序被存储在存储器中并被配置为由至少一个处理器执行,所述至少一个应用程序配置用于:执行权利要求1~7任一项所述的一种船舶邮件解析方法。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,当所述计算机程序在计算机中执行时,令所述计算机执行权利要求1~7任一项所述的一种船舶邮件解析方法。
技术总结
本申请涉及电子邮件的领域,尤其是涉及一种船舶邮件解析方法、装置、电子设备及存储介质。方法包括:获取待处理邮件;将待处理邮件的正文进行划分,得到至少一个待解析数据块;根据每个待解析数据块的数据,确定每个待解析数据块对应的数据类型,数据类型为待解析数据块中的数据的类型;当待解析数据块对应的数据类型存在盘类型时,解析待解析数据块,以确定待解析数据块中的盘类型数据,并将盘类型数据进行存储,其中,盘类型数据为类型属于盘类型的数据,盘类型包括船盘类型、货盘类型以及期租盘类型。本申请具有自动对船舶邮件进行解析,减小人力资源的浪费,同时提高船舶邮件的解析效率的效果。效率的效果。效率的效果。
技术研发人员:安超 董恒竞 苏鑫 周慧情
受保护的技术使用者:天津中远海运散运数字科技有限公司
技术研发日:2023.06.28
技术公布日:2023/8/1
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/