如何使用正则表达式提取微博中的话题(hashtag)?

最近在做社交网络数据挖掘,我想知道如何获取##中或者#后的内容,也就是相当于 twitter 中的 hashtag。
其中的格式就是成对出现的“#”符号或者由单个“#”开头然后以特殊符号结尾当中的内容,内容中允许出现西文和亚洲文字,一条正则需要能同时解决这两个问题。

阅读 8.3k
1 个回答
(?<=\#)[\s\S]*?(?=\#)
撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题