我想从网址中提取美国专利名称
(更新:正如评论所指出的那样,专利标题没有标注为"标题";但是,它在网页上一直显示在"摘要"之上.)在大多数情况下,它在"身体"的第7个子元素中或文件中的第3个"字体"元素,但偶尔会在页面顶部发出"**请参见图像:(校正证书)**"或"(复审证书)"的两种方法在你到达标题之前,通过插入一个额外的"body"子项和三个额外的"font"元素来提取.
但是,标题似乎始终是第一个"字体"元素,属性"大小"具有值"+1".不幸的是,其他元素的大小=" - 1",包括并不总是存在的上述元素,因此必须具体使用该属性和值.我已经搜索但无法弄清楚如何按属性和值获取元素.这是我的代码:
Function Test_UpdateTitle(url As String)
Dim title As String
Dim pageSource As String
Dim xml_obj As XMLHTTP60
Set xml_obj = CreateObject("MSXML2.XMLHTTP")
xml_obj.Open "GET", url, False
xml_obj.send
pageSource = xml_obj.responseText
Set xml_obj = Nothing
Dim html_doc As HTMLDocument
Set html_doc = CreateObject("HTMLFile")
html_doc.body.innerHTML = pageSource
Dim fontElement As IHTMLElement
'Methods 1 and 2 fail in cases of a certificate of correction or reexamination certificate
'Method 1
' Dim body As IHTMLElement
' Set body …Run Code Online (Sandbox Code Playgroud) 我需要在 Word 文档中获取当前的滚动位置(我认为这是正确的术语;即,我的虚拟镜头指向文档的位置,而不是我的光标所在的位置),以便在运行宏时可以返回最后到那个位置。
我写了一个宏,从当前光标位置向后搜索专利申请零件号,将候选的下一个可用零件号确定为前一个 max + 1,然后搜索出现在光标下方的数字的排序列表,以查看候选零件号与下一个使用的数字发生冲突,如果是,则将候选者加 1 并再次检查冲突,直到找到最小的未使用整数,以尽可能遵循在描述正文中引入部分的约定按零件号顺序。
然后它在当前光标位置插入该数字。它工作正常;但是,它会将当前行移动到查看窗口的顶部,这会令人迷惑。我宁愿将卷轴留在原处。这是我的代码:
Sub InsertLocalNextPartNum()
Application.ScreenUpdating = False
Dim re As VBScript_RegExp_55.RegExp
Set re = New VBScript_RegExp_55.RegExp
re.pattern = "\b(\d{2,3}\b)"
Run Code Online (Sandbox Code Playgroud)
' 2-3 位数字对于零件号来说有点过分,但就我的问题而言,我们不需要完整的正则表达式
re.IgnoreCase = False
re.Global = True
Dim txt As String
Dim allLongMatches As MatchCollection, m As Match
Dim nums() As Long
Dim numsColl As New Collection
Dim maxNum As Long
maxNum = 0
Dim nextPartNum As String
Dim localNextPartNum As String
localNextPartNum = 0
Dim i As Long
Dim j …Run Code Online (Sandbox Code Playgroud)