以下是一个简单的Python代码示例,用于从给定的文章中提取SEO关键词。这个示例使用了Python的Natural Language Toolkit(NLTK)库来进行文本处理和关键词提取。
import nltk
from nltk.tokenize import word_tokenize
from nltk.corpus import stopwords
from nltk.probability import FreqDist
from string import punctuation
# 文章示例
article = """
在今天的数字市场中,SEO关键词对于网站排名和流量至关重要。优化您的内容以包含与您的领域相关的关键词是提高搜索引擎排名的关键。
"""
# 将文章转换为小写
article = article.lower()
# 使用NLTK进行分词
tokens = word_tokenize(article)
# 去除停用词和标点符号
stop_words = set(stopwords.words('english') + list(punctuation))
filtered_tokens = [word for word in tokens if word not in stop_words]
# 使用NLTK的FreqDist计算词频
freq_dist = FreqDist(filtered_tokens)
# 获取最常见的5个词作为SEO关键词
top_keywords = freq_dist.most_common(5)
# 打印结果
print("Top 5 SEO Keywords:")
for keyword in top_keywords:
print(keyword[0])
这段代码首先导入NLTK库,并使用NLTK的word_tokenize函数将文章分词。然后,它去除了停用词和标点符号,并使用NLTK的FreqDist计算词频。最后,它打印出出现频率最高的5个词作为SEO关键词。
请确保您已安装NLTK库并下载了所需的语料库,您可以通过运行以下命令来下载NLTK语料库:
import nltk
nltk.download('punkt')
nltk.download('stopwords')
希望这可以帮助您提取文章的SEO关键词!