javascript - 抓取 javascript :void(0) content using python-6ren

javascript - 抓取 javascript :void(0) content using python

转载作者：行者123 更新时间：2023-11-30 20:19:37

25

4

我正在制作一个程序，其中我正在抓取一个网页并且内容从原始页面中隐藏并用于显示自己使用 herf = javascript:void(0) 链接和文本在 <p>然后 <span>标签。

这是我的代码:

import requests, re
from bs4 import BeautifulSoup

page = requests.get('https://www.naukri.com/job-listings-Python-Developer- 
Cloud-Analogy-Softech-Pvt-Ltd-Noida-Sector-63-Noida-1-to-2-years- 
250718003152?src=rcntSrchWithoutCount&sid=15327965116011&xp=1&px=1&qp=python%20developer&srcP%
20ge=s').text
soup = BeautifulSoup(page, 'html.parser')
link = soup.find('div', {'class':'jDisc 
viewContact'}).find_all(re.compile('p|em|span'))
results = [i.text for i in link]
print(results)

HTML 页面在这里:

<a href="javascript:void(0)" class="mt30 dspB f14 lH20"
id="viewCont_trg">View Contact Details</a>

点击“查看联系方式”链接后，会显示所有隐藏内容。你能帮我解决这个问题吗？

最佳答案

加载页面时，联系方式不在网页上。单击查看联系方式后，网页会发出新请求以获取联系方式。

为了找出从哪个 url 获取联系人详细信息，您可以打开 firefox 或 chrome，然后使用右键单击 > 检查元素(或只需按 f12)打开调试器。然后转到网络选项卡。单击“查看联系方式”并查看它提出的请求。我已经检查过了，它获取详细信息的网址是“https://www.naukri.com/jd/contactDetails?file=250718003152”。您可以从原始网址“https://www.naukri.com/job-listings-Python-Developer-”获取文件 ID 为 250718003152Cloud-Analogy-Softech-Pvt-Ltd-Noida-Sector-63-Noida-1-to-2-years-250718003152?src=rcntSrchWithoutCount&sid=15327965116011&xp=1&px=1&qp=python%20developer&srcP%20ge=s”。

因此，您所要做的就是使用 urllib 或您正在使用的任何内容向 url“https://www.naukri.com/jd/contactDetails?file=250718003152”发出新的获取请求。响应将在 json 中。您必须解析 json 并提取所需的字段。

关于javascript - 抓取 javascript :void(0) content using python，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/51591849/

25

4

0

文章推荐： c - 消除无序数组中的重复元素

文章推荐： c - 如何使用 CopyFile 函数复制多个文件？

文章推荐： javascript - 如何在 MVC 中实现

nav-tabs 使其表现得像

？

c - 将 void*(*)(void*) 类型转换为 void(*)(void)
作为作业的一部分，我正在尝试创建一个用户级线程库，如 pthreads。为了处理线程之间的上下文切换，我使用了“swapcontext”函数。在使用它之前，我必须使用“makecontext”函数创
c++ - 无法将 ‘void* (Network::*)(void*)’ 转换为 ‘void* (*)(void*)’
我是一名初级 C++ 程序员，我正在 Linux 机器上编程。我遇到了这个错误: cannot convert ‘void* (Network::*)(void*)’ to ‘void* (*)(v
c - 这个表达式 : void* (*fct)(void*(*)(void*), void*) 是什么意思？
我知道，例如 void *(*myFuncName)(void*) 是一个函数指针，它接受并返回 void*。这是一个有两个参数的指针吗？void 指针是该类型的另一个返回 void* 和 void
c - void (func)(void) 和 void (*func)(void) 声明为结构字段内的字段时的区别？
所以我被告知它们彼此几乎相同 void function1 (void(func)(int), int arg){ func(arg); } void function2 (void(*fun
c++ - 类型 'void* (...)(void*)' 的参数与 'void* (*)(void*) 不匹配
我目前正在 GNU Radio 上开发一个 bloc，我想使用一个线程。该线程用于从 UDP 套接字获取数据，因此我可以在我的 GNU Radio 集团中使用它。 “一般工作”功能是执行所有信号和数据
c++ - 无法在 pthread 中从类型 void* (类名)(void*) 转换为类型 void* (*)(void*)
我正在尝试在主函数中创建一个线程并通过我的线程调用另一个类的函数。在 main.cpp 中: SocketHandler *callserver; pthread_t thread1; pthrea
c++ - 错误 : argument of type ‘void* (Thread::)(void*)’ does not match ‘void* (*)(void*)’
我正在使用pthread 为我自己实现线程类。所以，我创建了 Thread 类如下: class Thread { public: Thread() { } virtual void*
c - 函数指针不兼容的指针类型 void (*)(void *) from void (my_type *)
我收到上述警告并理解它，但就是不知道如何解决它。我的代码在下面，但基本上我所做的是在结构中存储一个函数指针，并在我从 main.c 调用的另一个函数中初始化该结构。当我将代码与默认函数(即 free(
java - 扩展 AsyncTask
在我的 android 应用程序中，我在 doInBackground 中执行一些操作通过扩展 AsyncTask类(class)。 (我在这个类中执行任何 UI 都没用) 这是正确使用 AsyncT
c - 一个接受 void func(void) 和 void func(void* param) 的函数
我在 GNU 编译器集合中使用 C。所以我需要将函数指针传递给一个函数。现在有两种我想要处理的可接受的函数指针原型(prototype): void function(void); 和 void fu
c++ - 无法在 pthread_create 函数中将 '*void(MyClass::*)(void*) 转换为 void*(*)(void*)
我正在尝试使用“CameraManager”类创建一个新线程，但出现以下错误: cannot convert '*void(CameraManager:: * )(void*) to void*( *
c++ - 如何将 void (__thiscall MyClass::* )(void *) 转换为 void (__cdecl *)(void *) 指针
我想构建一个可以隐藏线程创建的“IThread”类。子类实现“ThreadMain”方法并使其自动调用，如下所示: class IThread { public: void BeginThre
c - 应为 'void (**)(void *, const char *)' 但参数类型为 'void (*)(void *, const char *)
我不明白什么 void (**)(void *, const char *) /* ^^ why are there 2 asterisks here? 意思是，它是一个指向函数的指针，但我失败
C++ PTHREADS - 无效的转换 void*(*)() 到 void*(*)(void*)
我必须将“risposta”类型的参数“r”发送到函数 RispostaServer。编译器给我:invalid conversion void*(*)() to void*(*)(void*) 这是
c++ - 从 `void *` 到 `void (*)(void*)` 的无效转换
所以我目前正在使用，或者至少正在尝试编写一个利用 this C pthread threadpool library. 的程序值得注意的是 thpool.h 中的以下函数: int thpool_a
c++ - 将不同的对象存储为 void* 并从 void* 转换到 void*
我正在尝试使用 void* 指针将不同的对象存储在一个全局表中。问题是如何取回 void* 对象。如果我有一个公共(public)基类，比如 Object ，我总是可以将 void* 指针存储为 Ob
c++ - 错误 : converting from ‘void (FlashWork::*)(int, siginfo_t*, void*)’ to ‘void* (*)(int, siginfo_t*, void*)’
我是一名 C 程序员(在 linux 上)，但现在我有一个关于 C++ 的项目，并且有一个问题。这里是示例代码 g_action.sa_sigaction = (void(*)(int,siginf
c++ - 无法从类型 void*(classname::) () 转换为类型 void*(*)(void*)
class Scoreget{ private: //some variables public: Scoreget(){ //
c - 使用 C void 参数 "void foo(void)"还是不使用 "void foo()"更好？
这个问题在这里已经有了答案: Is there a difference between foo(void) and foo() in C++ or C? (4 个答案) func() vs fun
c++ - 错误 : cannot convert 'void (CApp::*)()' to 'void (*)()' for argument '1' to 'void Mix_HookMusicFinished(void (*)())'
我正在尝试使用 SDL 和 SDL_Mixer 为音频创建一个 C++ 应用程序，并且正在尝试遵循 this教程。但是，使用 SDL_Mixer 的 Mix_HookMusicFinished() 不

首页

博学

6Ren·AI

商城

javascript - 抓取 javascript :void(0) content using python